MEDITRON：为医学领域特别设计的大语言模型

Heping 11月 30, 2023 2.98k 浏览 0

MEDITRON：为医学领域特别设计的大语言模型，该模型可用于多种医学相关任务，如医学文献分析、临床决策支持、病例研究等。

具备高级推理能力，能够进行复杂的医学知识推理和分析。

MEDITRON在多个医学基准测试中表现出色，超过了GPT-3.5和Med-PaLM，在某些方面接近GPT-4和Med-PaLM-2。

MEDITRON由洛桑联邦理工学院（EPFL）开发！

MEDITRON的功能：

专门针对医学领域：MEDITRON是为医学领域特别设计的大型语言模型，旨在处理和理解医学文献和数据。

多样化的应用：该模型可用于多种医学相关任务，如医学文献分析、临床决策支持、病例研究等。

高级推理能力：MEDITRON具备高级推理能力，能够进行复杂的医学知识推理和分析

训练和性能：

MEDITRON基于Llama-2训练，通过在综合策划的医学语料库上进行持续预训练，包括PubMed论文、摘要和国际认可的临床指南。

预训练过程中，模型学习了大量医学术语、概念、治疗方法和临床实践等相关知识。

包括70B和7B参数两个版本，在医学相关的TruthfulQA问题上，MEDITRON显著超过了之前的开源标准。其7B版本比PMC-Llama高出25.8%，而MEDITRON-70B超过Med42-70B 13.2%。

持续预训练和微调：

在初始预训练之后，MEDITRON还经历了持续的预训练和针对特定任务的微调，以提高其在特定医学任务上的表现。

微调过程使模型能够更好地适应特定的医学应用场景，如疾病诊断、治疗建议或医学文献分析。

GitHub：https://github.com/epfLLM/meditron
Huggingface：https://huggingface.co/epfl-llm

版权声明：除特殊说明外，本站所有文章均为字节点击原创内容，采用 BY-NC-SA 知识共享协议。原文链接：https://byteclicks.com/54454.html 转载时请以链接形式标明本文地址。转载本站内容不得用于任何商业目的。本站转载内容版权归原作者所有，文章内容仅代表作者独立观点，不代表字节点击立场。报道中出现的商标、图像版权及专利和其他版权所有的信息属于其合法持有人，只供传递信息之用，非商务用途。如有侵权，请联系 gavin@byteclicks.com。我们将协调给予处理。

MEDITRON：为医学领域特别设计的大语言模型

文章推荐：

标签