蚂蚁集团开源医疗专科推理数据集RJUA-QA，覆盖97.6%泌尿科患者

Heping 12月 28, 2023 7.3k 浏览 0

蚂蚁集团今日宣布开源首个医疗专科推理数据集。该数据集名为RJUA-QA，由训练、验证和测试三部分组成，包含2132个问答对。每个问答对由医生根据临床经验编写的问题、专家提供的回答以及用于帮助推理的上下文构成。该数据集覆盖了97.6%以上的泌尿科就医人群，旨在真实复刻诊疗场景。

在医疗行业中，通用型语言模型在应对医疗问诊时通常会直接给出答案。然而，医生在诊断过程中会根据专业知识进行反复的症状探讨，才能给出准确的答案。此外，大型语言模型在幻觉问题和推理能力方面存在一定的局限性。目前，高质量的中文医学专科数据集相对较为稀缺，这给训练出色的医疗领域大型语言模型提出了挑战。

为了克服这些难题，蚂蚁集团与上海仁济医院泌尿科专家团队联合研发了RJUA-QA数据集。该数据集基于医生团队的临床经验，通过构造模拟病例数据的方式推出。这也是业内首个临床专科数据集。蚂蚁集团联合医疗专家共同研发了多模态医疗知识引擎，进一步推动中国专业医疗数据集的构建与开放。

RJUA-QA已在GitHub上开源，该数据集的病例数据由专业医生根据临床经验编写而成，不涉及任何医患个人隐私。

版权声明：除特殊说明外，本站所有文章均为字节点击原创内容，采用 BY-NC-SA 知识共享协议。原文链接：https://byteclicks.com/55167.html 转载时请以链接形式标明本文地址。转载本站内容不得用于任何商业目的。本站转载内容版权归原作者所有，文章内容仅代表作者独立观点，不代表字节点击立场。报道中出现的商标、图像版权及专利和其他版权所有的信息属于其合法持有人，只供传递信息之用，非商务用途。如有侵权，请联系 gavin@byteclicks.com。我们将协调给予处理。

蚂蚁集团开源医疗专科推理数据集RJUA-QA，覆盖97.6%泌尿科患者

文章推荐：

标签