DATASET
Open Source Community
BelleGroup/train_0.5M_CN
包含约50万条由BELLE项目生成的中文指令数据。每条数据包含一个指令、输入(本数据集均为空)和输出。
Updated 4/3/2023
hugging_face
Description
数据集概述
基本信息
- 许可证: GPL-3.0
- 任务类别: 文本到文本生成
- 语言: 中文
- 数据集大小: 10万至100万条数据
内容描述
- 数据来源: BELLE项目
- 数据量: 约50万条中文指令数据
数据结构
- 字段说明:
- instruction: 指令
- input: 输入(数据集中的输入均为空)
- output: 输出
使用限制
- 使用目的: 仅限于研究目的
- 禁止用途: 不得用于商业用途或可能对社会造成危害的用途
- 免责声明: 本数据集不代表任何立场、利益或想法,使用本数据集造成的任何损害、纠纷,本项目不承担责任。
AI studio
Generate PPTs instantly with Nano Banana Pro.
Generate PPT NowAccess Dataset
Login to Access
Please login to view download links and access full dataset details.
Topics
Natural Language Processing
Chinese Language Models
Source
Organization: hugging_face
Created: Unknown
Power Your Data Analysis with Premium AI Models
Supporting GPT-5, Claude-4, DeepSeek v3, Gemini and more.
Enjoy a free trial and save 20%+ compared to official pricing.