小伙伴们期待已久的数据集资源盘点系列又来啦~
本期将分享64个图像分类任务相关的热门公开数据集资源,粗略分了10类:
● 通用视觉类;● 手写体&单通道类;● 细粒度图像识别类;● 自然界图像和场景类;● 遥感类;● 医疗健康类;● 科学教育类;● 艺术类;● 食物类;● 生活场景类。
快来看看有没有你想要的吧。
如果觉得不错的话,记得收藏。更多资源,欢迎访问OpenDataLab官网:https://opendatalab.org.cn/
目录
一、通用视觉类
No.1 CIFAR-10
No.2 CIFAR-100
No.3 STL-10
No.4 PASCAL VOC2007
No.5 PASCAL VOC2012
No.6 ImageNet-P
No.7 ImageNet-Sketch
No.8 ObjectNet
No.9 Open Images V4
No.10 ImageNet-21k
No.11 ImageNet-O
No.12 DEIC Benchmark (Data-Efficient Image Classification Benchmark)
No.13 OmniBenchmark
No.14 Caltech-256
No.15 CIFAR-10N (Real-World Human Annotations)
No.16 CIFAR-100N (Real-World Human Annotations)
二、手写体&单通道类
No.17 MNIST
No.18 Fashion-MNIST
No.19 MultiMNIST
No.20 EMNIST (Extended MNIST)
No.21 Kuzushiji-49
No.22 Kuzushiji-Kanji
三、细粒度图像识别类
No.23 SUN Attribute
No.24 Oxford-IIIT Pet
No.25 FGVC Aircraft
No.26 DTD (Describable Textures Dataset)
No.27 CUB-200-2011
四、自然界图像和场景类
No.28 IP102
No.29 Places365
No.30 Imagenette
No.31 AIDER
No.32 DeepFish
No.33 iNaturalist2021
五、遥感类
No.34 EuroSAT
No.35 BigEarthNet
No.36 So2Sat LCZ42
No.37 MLRSNet
No.38 df2k_ost
No.39 Million-AID
六、医疗健康类
No.40 HErlev (HErlev Pap Smear Dataset)
No.41 BBBC041 (P. vivax (malaria) infected human blood smears)
No.42 Chest-Xray8 (COVID-19)
七、科学教育类
No.43 PlantVillage
No.44 PlantDoc
No.45 AI2D (AI2 Diagrams)
No.46 ANIMAL (ANIMAL-10N)
No.47 FruitsAndVegetables
八、艺术类
No.48 iCartoonFace
No.49 KaoKore
No.50 MAMe (Museum Art Medium dataset)
No.51 ArtDL
九、食物类
No.52 Food-101
No.53 ECUSTFD (ECUST Food Dataset)
No.54 ChineseFoodNet
No.55 THFOOD-50 (Thai Food 50 Image Classification)
No.56 KenyanFood13
No.57 MyFood Dataset
十、生活场景类
No.58 SVHN
No.59 Clothing1M
No.60 Stanford Online Products
No.61 Grocery Store
No.62 ARC-100
No.63 FoodLogoDet-1500
No.64 Icon645
一、通用视觉类
No.1 CIFAR-10
● 发布方:麻省理工学院 · 纽约大学
● 发布时间:2009
● 下载链接:https://opendatalab.org.cn/CIFAR-10
● 关键词:通用视觉对象识别、十个类别
No.2 CIFAR-100
● 发布方:麻省理工学院 · 纽约大学
● 发布时间:2009
● 下载链接:https://opendatalab.org.cn/CIFAR-100
● 关键词:通用视觉对象识别、一百个类别
No.3 STL-10
● 发布方:斯坦福大学 · 密歇根大学
● 发布时间:2011
● 下载链接:https://opendatalab.org.cn/STL-10
● 关键词:广泛用于无监督特征学习算法评估
No.4 PASCAL VOC2007
● 发布方:牛津大学 · 微软剑桥研究院 · 利兹大学
● 发布时间:2007
● 下载链接:https://opendatalab.org.cn/PASCAL_VOC2007
● 关键词:目标检测
No.5 PASCAL VOC2012
● 发布方:牛津大学 · 利兹大学 · 微软剑桥研究院
● 发布时间:2012
● 下载链接:https://opendatalab.org.cn/PASCAL_VOC2012
● 关键词:目标检测
No.6 ImageNet-P
● 发布方:加州大学 · 俄勒冈州立大学
● 发布时间:2019
● 下载链接:https://opendatalab.org.cn/ImageNet-P
● 关键词:由噪声、模糊、天气和数字失真组成
No.7 ImageNet-Sketch
● 发布方:卡内基梅隆大学
● 发布时间:2019
● 下载链接:https://opendatalab.org.cn/ImageNet-Sketch
● 关键词:黑白线稿草图
No.8 ObjectNet
● 发布方:麻省理工学院
● 发布时间:2019
● 下载链接:https://opendatalab.org.cn/ObjectNet
● 关键词:无监督图像分类
No.9 Open Images V4
● 发布方:Google Research
● 发布时间:2020
● 下载链接:https://opendatalab.org.cn/Open_Images_V4
● 关键词:大规模图像分类数据集、单图多标签标注
No.10 ImageNet-21k
● 发布方:斯坦福大学 · 普林斯顿大学 · 北卡罗来纳大学教堂山分校 · Facebook · Shopagon
● 发布时间:2021
● 下载链接:https://opendatalab.org.cn/ImageNet-21k
● 关键词:通用视觉对象识别
No.11 ImageNet-O
● 发布方:加州大学伯克利分校 · 华盛顿大学 · 芝加哥大学
● 发布时间:2021
● 下载链接:https://opendatalab.org.cn/ImageNet-O
● 关键词:包含来自 ImageNet-1k 数据集中没有的类的图像,用于测试视觉模型对分布外样本的鲁棒性
No.12 DEIC Benchmark (Data-Efficient Image Classification Benchmark)
● 发布方:罗马大学 · 耶拿大学
● 发布时间:2021
● 下载链接:https://opendatalab.org.cn/DEIC_Benchmark
● 关键词:由6个数据集组成、涵盖多个图像领域和数据类型
No.13 OmniBenchmark
● 发布方:商汤科技研究所 · 南洋理工大学实验室
● 发布时间:2022
● 下载链接:https://opendatalab.org.cn/OmniBenchmark
● 关键词:通用视觉对象识别、覆盖大多数视觉领域
No.14 Caltech-256
● 发布方:加州理工学院
● 发布时间:2022
● 下载链接:https://opendatalab.org.cn/Caltech-256
● 关键词:图像物体识别
No.15 CIFAR-10N (Real-World Human Annotations)
● 发布方:加州大学 · 悉尼大学 · 日本理化学研究所先进智能研究中心
● 发布时间:2022
● 下载链接:https://opendatalab.org.cn/CIFAR-10N
● 关键词:通用视觉对象识别、加入真实世界噪声标签
No.16 CIFAR-100N (Real-World Human Annotations)
● 发布方:加州大学 · 悉尼大学
● 发布时间:2022
● 下载链接:https://opendatalab.org.cn/CIFAR-100N
● 关键词:通用视觉对象识别、加入真实世界噪声标签
二、手写体&单通道类
No.17 MNIST
● 发布方:纽约大学 · Google · 微软
● 发布时间:1998
● 下载链接:https://opendatalab.org.cn/MNIST
● 关键词:手写数字识别
No.18 Fashion-MNIST
● 发布方:Zalando Research
● 发布时间:2017
● 下载链接:https://opendatalab.org.cn/Fashion-MNIST
● 关键词:服装分类、十个类别
No.19 MultiMNIST
● 发布方:Google
● 发布时间:2017
● 下载链接:https://opendatalab.org.cn/MultiMNIST
● 关键词:手写字母识别、数字叠加、重叠
No.20 EMNIST (Extended MNIST)
● 发布方:西悉尼大学
● 发布时间:2017
● 下载链接:https://opendatalab.org.cn/EMNIST
● 关键词:手写字母识别、细粒度图像分类
No.21 Kuzushiji-49
● 发布方:ROIS-DS Center for Open Data in the Humanities · 吉尔福德皇家文法学校 · 国立日本文学研究所 · Mila – Quebec Artifcial Intelligence Institute · Google AI Research
● 发布时间:2018
● 下载链接:https://opendatalab.org.cn/Kuzushiji-49
● 关键词:手写字符识别、日语假名
No.22 Kuzushiji-Kanji
● 发布方:ROIS-DS Center for Open Data in the Humanities · 吉尔福德皇家文法学校 · 国立日本文学研究所 · Mila – Quebec Artifcial Intelligence Institute · Google AI Research
● 发布时间:2018
● 下载链接:https://opendatalab.org.cn/Kuzushiji-Kanji
● 关键词:手写字符识别、日本汉字草书风格
三、细粒度图像识别类
No.23 SUN Attribute
● 发布方:海斯实验室
● 发布时间:2011
● 下载链接:https://opendatalab.org.cn/SUN_Attribute
● 关键词:细粒度场景识别、高级场景理解
No.24 Oxford-IIIT Pet
● 发布方:牛津大学
● 发布时间:2012
● 下载链接:https://opendatalab.org.cn/Oxford-IIIT_Pets
● 关键词:细粒度图像分类、图像压缩
No.25 FGVC Aircraft
● 发布方:奥卢大学 · TTI, Inc. · 巴黎中央学校 · 牛津大学
● 发布时间:2013
● 下载链接:https://opendatalab.org.cn/FGVC_Aircraft
● 关键词:细粒度视觉分类、飞机图像
No.26 DTD (Describable Textures Dataset)
● 发布方:牛津大学 · Toyota Technological Institute · 巴黎中央学校 · 石溪大学
● 发布时间:2014
● 下载链接:https://opendatalab.org.cn/DTD
● 关键词:纹理分类
No.27 CUB-200-2011
● 发布方:Allan Lab
● 发布时间:2017
● 下载链接:https://opendatalab.org.cn/CUB-200-2011
● 关键词:细粒度图像分类、局部区域定位、鸟类
四、自然界图像和场景类
No.28 IP102
● 发布方:南开大学计算机学院 · 卡迪夫大学
● 发布时间:2019
● 下载链接:https://opendatalab.org.cn/IP102
● 关键词:自然界图像、呈现自然的长尾发布
No.29 Places365
● 发布方:马德里自治大学
● 发布时间:2020
● 下载链接:https://opendatalab.org.cn/Places365
● 关键词:图像分类、场景识别
No.30 Imagenette
● 发布方:旧金山大学
● 发布时间:2020
● 下载链接:https://opendatalab.org.cn/Imagenette
● 关键词: Imagenet 中 10 个易于分类的类别的子集(板凳、英语弹跳器、磁带播放器、链锯、教堂、圆号、垃圾车、加油站、高尔夫球、降落伞)
No.31 AIDER
● 发布方:塞浦路斯大学
● 发布时间:2020
● 下载链接:https://opendatalab.org.cn/AIDER
● 关键词:无人机视角、灾难事件、空中场景分类
No.32 DeepFish
● 发布方:詹姆斯库克大学 · 不列颠哥伦比亚大学 · Element AI
● 发布时间:2020
● 下载链接:https://opendatalab.org.cn/DeepFish
● 关键词:热带海洋环境、水下鱼监控
No.33 iNaturalist2021
● 发布方:康奈尔大学 · 加州理工学院 · Google · 爱丁堡大学
● 发布时间:2021
● 下载链接:https://opendatalab.org.cn/iNaturalist2021
● 关键词:1万个种类
五、遥感类
No.34 EuroSAT
● 发布方:德国人工智能研究中心 · 凯泽斯劳滕工业大学
● 发布时间:2019
● 下载链接:https://opendatalab.org.cn/EuroSAT
● 关键词:土地利用和覆盖分类
No.35 BigEarthNet
● 发布方:柏林工业大学 · 德国人工智能研究中心
● 发布时间:2019
● 下载链接:https://opendatalab.org.cn/BigEarthNet
● 关键词:遥感场景分类
No.36 So2Sat LCZ42
● 发布方:慕尼黑工业大学
● 发布时间:2019
● 下载链接:https://opendatalab.org.cn/So2Sat_LCZ42
● 关键词:由多光谱光学图像数据及相应的局部气候标签组成
No.37 MLRSNet
● 发布方:中国地质大学 · 重庆邮电大学 · 北京师范大学 · 雅典大学
● 发布时间:2020
● 下载链接:https://opendatalab.org.cn/MLRSNet
● 关键词:多标签高空间分辨率遥感图像
No.38 df2k_ost
● 发布方:腾讯 · 中国科学院深圳先进技术研究院 · 中国科学院 · 中国科学院大学 · 上海人工智能实验室
● 发布时间:2021
● 下载链接:https://opendatalab.org.cn/df2k_ost
● 关键词:高质量图像超分辨率和恢复数据集
No.39 Million-AID
● 发布方:武汉大学 · 中国科学院 · 特温特大学 · 德国航空航天中心 · 慕尼黑工业大学
● 发布时间:2021
● 下载链接:https://opendatalab.org.cn/Million-AID
● 关键词:遥感场景分类、大型基准数据集
六、医疗健康类
No.40 HErlev (HErlev Pap Smear Dataset)
● 发布方:爱琴海大学
● 发布时间:2008
● 下载链接:https://opendatalab.org.cn/HErlev
● 关键词:健康和癌性细胞涂片
No.41 BBBC041 (P. vivax (malaria) infected human blood smears)
● 发布方:麻省理工学院
● 发布时间:2012
● 下载链接:https://opendatalab.org.cn/BBBC041
● 关键词:疟原虫感染、人体血液涂片
No.42 Chest-Xray8 (COVID-19)
● 发布方:医疗公园医院 · 菲拉特大学 · 布里斯托尔大学 · 芒祖尔大学 · 义安理工学院 · 亚洲大学 · 熊本大学
● 发布时间:2020
● 下载链接:https://opendatalab.org.cn/Chest-Xray8
● 关键词:胸部X射线、 COVID-19、肺炎
七、科学教育类
No.43 PlantVillage
● 发布方:安那大学
● 发布时间:2019
● 下载链接:https://opendatalab.org.cn/PlantVillage
● 关键词:植物叶片
No.44 PlantDoc
● 发布方:印度理工学院甘地纳加尔分校
● 发布时间:2019
● 下载链接:https://opendatalab.org.cn/PlantDoc
● 关键词:植物病害检测
No.45 AI2D (AI2 Diagrams)
● 发布方:艾伦人工智能研究所
● 发布时间:2016
● 下载链接:https://opendatalab.org.cn/AI2D
● 关键词:小学科学图表、图文问答
No.46 ANIMAL (ANIMAL-10N)
● 发布方:韩国科学技术院
● 发布时间:2019
● 下载链接:https://opendatalab.org.cn/ANIMAL
● 关键词:5 对相似动物
No.47 FruitsAndVegetables
● 发布方:未知
● 发布时间:2022
● 下载链接:https://opendatalab.org.cn/FruitsAndVegetables
● 关键词:常见水果、蔬菜识别
八、艺术类
No.48 iCartoonFace
● 发布方:爱奇艺 · 北京航空航天大学虚拟现实技术与系统国家重点实验室
● 发布时间:2020
● 下载链接:https://opendatalab.org.cn/iCartoonFace
● 关键词:包含多种风格的卡通人脸检测大规模数据集
No.49 KaoKore
● 发布方:Google AI Research · 剑桥大学 · 国立情报学研究所
● 发布时间:2020
● 下载链接:https://opendatalab.org.cn/KaoKore
● 关键词:近代日本艺术品中提取的面孔
No.50 MAMe (Museum Art Medium dataset)
● 发布方:巴塞罗那超级计算中心 · 巴塞罗那大学 · 加泰罗尼亚理工大学
● 发布时间:2020
● 下载链接:https://opendatalab.org.cn/MAMe
● 关键词:显著高分辨率和可变形状属性、博物馆艺术品材料和工艺
No.51 ArtDL
● 发布方:米兰理工大学
● 发布时间:2021
● 下载链接:https://opendatalab.org.cn/ArtDL
● 关键词:绘画图像、大多数来自文艺复兴时期
九、食物类
No.52 Food-101
● 发布方:苏黎世联邦理工学院 · 鲁汶天主教大学
● 发布时间:2014
● 下载链接:https://opendatalab.org.cn/Food-101
● 关键词:101类食物
No.53 ECUSTFD (ECUST Food Dataset)
● 发布方:华东理工大学
● 发布时间:2017
● 下载链接:https://opendatalab.org.cn/ECUSTFD
● 关键词:硬币和餐盘标定的食物图像、食物卡路里计算
No.54 ChineseFoodNet
● 发布方:美的新兴技术中心 · 美的人工智能研究院
● 发布时间:2017
● 下载链接:https://opendatalab.org.cn/ChineseFoodNet
● 关键词:食物识别、中餐菜谱/食物图片、跨模态信息检索
No.55 THFOOD-50 (Thai Food 50 Image Classification)
● 发布方:纳瑞宣大学
● 发布时间:2018
● 下载链接:https://opendatalab.org.cn/THFOOD-50
● 关键词:50种泰国食物图像、手机识别
No.56 KenyanFood13
● 发布方:纳瑞宣大学
● 发布时间:2018
● 下载链接:https://opendatalab.org.cn/KenyanFood13
● 关键词:肯尼亚食物图像
No.57 MyFood Dataset
● 发布方:伯南布哥农村联邦大学
● 发布时间:2020
● 下载链接:https://opendatalab.org.cn/MyFood_Dataset
● 关键词:巴西食物图像
十、生活场景类
No.58 SVHN
● 发布方:斯坦福大学
● 发布时间:2011
● 下载链接:https://opendatalab.org.cn/SVHN
● 关键词:光学字符识别、街景门牌号
No.59 Clothing1M
● 发布方:香港中文大学 · 百度
● 发布时间:2015
● 下载链接:https://opendatalab.org.cn/Clothing1M
● 关键词:在线购物网站收集的14类服装图像
No.60 Stanford Online Products
● 发布方:斯坦福大学 · 麻省理工学院
● 发布时间:2016
● 下载链接:https://opendatalab.org.cn/Stanford_online_Products
● 关键词:22634 类、120053 张网上销售的产品图片
No.61 Grocery Store
● 发布方:瑞典皇家理工学院 · 微软研究院
● 发布时间:2019
● 下载链接:https://opendatalab.org.cn/Grocery_Store
● 关键词:杂货店杂货自然图像、手机拍摄
No.62 ARC-100
● 发布方:拉合尔工程技术大学
● 发布时间:2021
● 下载链接:https://opendatalab.org.cn/ARC-100
● 关键词:巴基斯坦100种常见零售商品、自动零售结账
No.63 FoodLogoDet-1500
● 发布方:山东师范大学 · 中国科学院
● 发布时间:2021
● 下载链接:https://opendatalab.org.cn/FoodLogoDet-1500
● 关键词:大型食品商标数据集
No.64 Icon645
● 发布方:加州大学洛杉矶分校 · 中山大学 · 华东师范大学 · 哥伦比亚大学
● 发布时间:2022
● 下载链接:https://opendatalab.org.cn/Icon645
● 关键词:大规模图标图像数据集
以上就是本次分享,更多精彩的数据集干货,欢迎访问OpenDataLab官网:https://opendatalab.org.cn/。还有哪些想看的内容,快来告诉小助手吧。
- End -