JUHE API Marketplace
DATASET
Open Source Community

tomas-gajarsky/cifar100-lt

CIFAR-100-LT是一个不平衡的数据集,包含不到60,000张32x32像素的彩色图像,分布在100个不同的类别中。每个类别的样本数量呈指数级减少,数据集包括10,000张测试图像,每类100张,以及少于50,000张训练图像。这100个类别进一步组织成20个超类。每个图像都被分配了两个标签:一个表示特定类别的精细标签和一个表示相关超类的粗略标签。

Updated 12/10/2023
hugging_face

Description

数据集概述

数据集描述

  • 数据集名称: Cifar100-LT
  • 数据集类型: 图像分类
  • 语言: 英语
  • 许可: Apache 2.0
  • 数据集大小: 10K<n<100K
  • 源数据集: cifar100
  • 任务类别: 图像分类
  • 数据集ID: cifar-100

数据集摘要

CIFAR-100-LT 不平衡数据集包含不到 60,000 张彩色图像,每张图像尺寸为 32x32 像素,分布在 100 个不同的类别中。每个类别的样本数量呈指数级减少,因子为 10 和 100。数据集包含 10,000 张测试图像,每个类别 100 张图像,以及少于 50,000 张训练图像。这 100 个类别进一步组织成 20 个超类。每张图像有两个标签:一个细标签表示特定类别,一个粗标签表示相关超类。

支持的任务和排行榜

  • 图像分类: 目标是将给定图像分类到 100 个类别中的一个。排行榜可在此处查看。

数据集结构

数据实例

一个来自训练集的样本如下:

json { "img": "<PIL.PngImagePlugin.PngImageFile image mode=RGB size=32x32 at 0x2767F58E080>", "fine_label": 19, "coarse_label": 11 }

数据字段

  • img: 一个 PIL.Image.Image 对象,包含 32x32 图像。
  • fine_label: 一个 int 分类标签,映射如下:
    • 0: apple
    • 1: aquarium_fish
    • ...
    • 99: worm
  • coarse_label: 一个 int 粗分类标签,映射如下:
    • 0: aquatic_mammals
    • 1: fish
    • ...
    • 19: vehicles_2

数据分割

名称训练集测试集
cifar100<5000010000

许可信息

Apache License 2.0

引用信息

plaintext @TECHREPORT{Krizhevsky09learningmultiple, author = {Alex Krizhevsky}, title = {Learning multiple layers of features from tiny images}, institution = {}, year = {2009} }

贡献

感谢 @gchhablani 及所有贡献者添加原始平衡的 cifar100 数据集。

AI studio

Generate PPTs instantly with Nano Banana Pro.

Generate PPT Now

Access Dataset

Login to Access

Please login to view download links and access full dataset details.

Topics

Long-Tail Learning
Image Classification

Source

Organization: hugging_face

Created: Unknown

Power Your Data Analysis with Premium AI Models

Supporting GPT-5, Claude-4, DeepSeek v3, Gemini and more.

Enjoy a free trial and save 20%+ compared to official pricing.