数据集概述

数据集描述

数据集名称: Cifar100-LT
数据集类型: 图像分类
语言: 英语
许可: Apache 2.0
数据集大小: 10K<n<100K
源数据集: cifar100
任务类别: 图像分类
数据集ID: cifar-100

数据集摘要

CIFAR-100-LT 不平衡数据集包含不到 60,000 张彩色图像，每张图像尺寸为 32x32 像素，分布在 100 个不同的类别中。每个类别的样本数量呈指数级减少，因子为 10 和 100。数据集包含 10,000 张测试图像，每个类别 100 张图像，以及少于 50,000 张训练图像。这 100 个类别进一步组织成 20 个超类。每张图像有两个标签：一个细标签表示特定类别，一个粗标签表示相关超类。

支持的任务和排行榜

图像分类: 目标是将给定图像分类到 100 个类别中的一个。排行榜可在此处查看。

数据集结构

数据实例

一个来自训练集的样本如下：

json { "img": "<PIL.PngImagePlugin.PngImageFile image mode=RGB size=32x32 at 0x2767F58E080>", "fine_label": 19, "coarse_label": 11 }

数据字段

img: 一个 PIL.Image.Image 对象，包含 32x32 图像。
fine_label: 一个 int 分类标签，映射如下：
- 0: apple
- 1: aquarium_fish
- ...
- 99: worm
coarse_label: 一个 int 粗分类标签，映射如下：
- 0: aquatic_mammals
- 1: fish
- ...
- 19: vehicles_2

数据分割

名称	训练集	测试集
cifar100	<50000	10000

许可信息

Apache License 2.0

引用信息

plaintext @TECHREPORT{Krizhevsky09learningmultiple, author = {Alex Krizhevsky}, title = {Learning multiple layers of features from tiny images}, institution = {}, year = {2009} }

贡献

感谢 @gchhablani 及所有贡献者添加原始平衡的 cifar100 数据集。

tomas-gajarsky/cifar100-lt

Description