JUHE API Marketplace
DATASET
Open Source Community

BelleGroup/train_0.5M_CN

包含约50万条由BELLE项目生成的中文指令数据。每条数据包含一个指令、输入(本数据集均为空)和输出。

Updated 4/3/2023
hugging_face

Description

数据集概述

基本信息

  • 许可证: GPL-3.0
  • 任务类别: 文本到文本生成
  • 语言: 中文
  • 数据集大小: 10万至100万条数据

内容描述

  • 数据来源: BELLE项目
  • 数据量: 约50万条中文指令数据

数据结构

  • 字段说明:
    • instruction: 指令
    • input: 输入(数据集中的输入均为空)
    • output: 输出

使用限制

  • 使用目的: 仅限于研究目的
  • 禁止用途: 不得用于商业用途或可能对社会造成危害的用途
  • 免责声明: 本数据集不代表任何立场、利益或想法,使用本数据集造成的任何损害、纠纷,本项目不承担责任。

AI studio

Generate PPTs instantly with Nano Banana Pro.

Generate PPT Now

Access Dataset

Login to Access

Please login to view download links and access full dataset details.

Topics

Natural Language Processing
Chinese Language Models

Source

Organization: hugging_face

Created: Unknown

Power Your Data Analysis with Premium AI Models

Supporting GPT-5, Claude-4, DeepSeek v3, Gemini and more.

Enjoy a free trial and save 20%+ compared to official pricing.