tomas-gajarsky/cifar100-lt
CIFAR-100-LT是一个不平衡的数据集,包含不到60,000张32x32像素的彩色图像,分布在100个不同的类别中。每个类别的样本数量呈指数级减少,数据集包括10,000张测试图像,每类100张,以及少于50,000张训练图像。这100个类别进一步组织成20个超类。每个图像都被分配了两个标签:一个表示特定类别的精细标签和一个表示相关超类的粗略标签。
Description
数据集概述
数据集描述
- 数据集名称: Cifar100-LT
- 数据集类型: 图像分类
- 语言: 英语
- 许可: Apache 2.0
- 数据集大小: 10K<n<100K
- 源数据集: cifar100
- 任务类别: 图像分类
- 数据集ID: cifar-100
数据集摘要
CIFAR-100-LT 不平衡数据集包含不到 60,000 张彩色图像,每张图像尺寸为 32x32 像素,分布在 100 个不同的类别中。每个类别的样本数量呈指数级减少,因子为 10 和 100。数据集包含 10,000 张测试图像,每个类别 100 张图像,以及少于 50,000 张训练图像。这 100 个类别进一步组织成 20 个超类。每张图像有两个标签:一个细标签表示特定类别,一个粗标签表示相关超类。
支持的任务和排行榜
- 图像分类: 目标是将给定图像分类到 100 个类别中的一个。排行榜可在此处查看。
数据集结构
数据实例
一个来自训练集的样本如下:
json { "img": "<PIL.PngImagePlugin.PngImageFile image mode=RGB size=32x32 at 0x2767F58E080>", "fine_label": 19, "coarse_label": 11 }
数据字段
img: 一个PIL.Image.Image对象,包含 32x32 图像。fine_label: 一个int分类标签,映射如下:0: apple1: aquarium_fish- ...
99: worm
coarse_label: 一个int粗分类标签,映射如下:0: aquatic_mammals1: fish- ...
19: vehicles_2
数据分割
| 名称 | 训练集 | 测试集 |
|---|---|---|
| cifar100 | <50000 | 10000 |
许可信息
Apache License 2.0
引用信息
plaintext @TECHREPORT{Krizhevsky09learningmultiple, author = {Alex Krizhevsky}, title = {Learning multiple layers of features from tiny images}, institution = {}, year = {2009} }
贡献
感谢 @gchhablani 及所有贡献者添加原始平衡的 cifar100 数据集。
AI studio
Generate PPTs instantly with Nano Banana Pro.
Generate PPT NowAccess Dataset
Please login to view download links and access full dataset details.
Topics
Source
Organization: hugging_face
Created: Unknown
Power Your Data Analysis with Premium AI Models
Supporting GPT-5, Claude-4, DeepSeek v3, Gemini and more.
Enjoy a free trial and save 20%+ compared to official pricing.