好望角:让你的每次点击都有价值:byteclicks.com | 搜索引擎正在被AI污染信息源,中文优质信息越来越少了 |

MEDITRON:为医学领域特别设计的大语言模型

MEDITRON:为医学领域特别设计的大语言模型,该模型可用于多种医学相关任务,如医学文献分析、临床决策支持、病例研究等。

具备高级推理能力,能够进行复杂的医学知识推理和分析。

MEDITRON在多个医学基准测试中表现出色,超过了GPT-3.5和Med-PaLM,在某些方面接近GPT-4和Med-PaLM-2。

MEDITRON由洛桑联邦理工学院(EPFL)开发!

MEDITRON的功能:

专门针对医学领域:MEDITRON是为医学领域特别设计的大型语言模型,旨在处理和理解医学文献和数据。

多样化的应用:该模型可用于多种医学相关任务,如医学文献分析、临床决策支持、病例研究等。

高级推理能力:MEDITRON具备高级推理能力,能够进行复杂的医学知识推理和分析

训练和性能:

MEDITRON基于Llama-2训练,通过在综合策划的医学语料库上进行持续预训练,包括PubMed论文、摘要和国际认可的临床指南。

预训练过程中,模型学习了大量医学术语、概念、治疗方法和临床实践等相关知识。

包括70B和7B参数两个版本,在医学相关的TruthfulQA问题上,MEDITRON显著超过了之前的开源标准。其7B版本比PMC-Llama高出25.8%,而MEDITRON-70B超过Med42-70B 13.2%。

持续预训练和微调:

在初始预训练之后,MEDITRON还经历了持续的预训练和针对特定任务的微调,以提高其在特定医学任务上的表现。

微调过程使模型能够更好地适应特定的医学应用场景,如疾病诊断、治疗建议或医学文献分析。


GitHub:https://github.com/epfLLM/meditron
Huggingface:https://huggingface.co/epfl-llm

上一篇:

下一篇:


标签