Back to datasets
Dataset assetOpen Source CommunityInsurance QAResearch Corpus
insuranceqa-corpus-zh
本数据集使用翻译 [insuranceQA](https://github.com/shuzi/insuranceQA)而生成,代码发布证书 GPL 3.0。数据仅限于研究用途,如果在发布的任何媒体、期刊、杂志或博客等内容时,必须注明引用和地址。
Source
github
Created
Jun 29, 2019
Updated
Jun 12, 2020
Signals
149 views
Availability
Linked source ready
Overview
Dataset description and usage context
保险行业语料库
数据集描述
- 名称: 保险行业语料库
- 详细文档: 链接
用户评价
- fssqawj (East China Normal University): 数据集适用于保险领域的中文问答研究,短问题翻译准确,长答案翻译存在不连贯问题,关键词和上下文信息丰富,评价为优秀的中文语料。
- rgtjf (East China Normal University): 评价为“Excellent work!”
基线模型
- 模型参数: mini-batch size = 100, hidden_layers = [100, 50], lr = 0.0001
- 性能指标:
- 准确率: 0.9031 (Epoch 25, total step 36400)
- 成本: 1.056221
使用许可与引用要求
-
数据来源: 翻译自 insuranceQA
-
许可: 代码发布证书 GPL 3.0
-
使用限制: 数据仅限于研究用途
-
引用格式:
InsuranceQA Corpus, Hai Liang Wang, https://github.com/Samurais/insuranceqa-corpus-zh, 07 27, 2017
-
衍生数据要求: 衍生数据需开放,并需声明与“声明1”和“声明2”一致的内容。
-
引用论文: Applying Deep Learning to Answer Selection: A Study and An Open Task by Minwei Feng, Bing Xiang, Michael R. Glass, Lidan Wang, Bowen Zhou @ 2015
Need downstream help?
Pair the dataset with AI analysis and content workflows.
Once the source passes your review, move straight into summarization, transformation, report drafting, or presentation generation with the JuheAI toolchain.