微软发布最新开发的小型语言模型Phi-2

Heping 12月 13, 2023 1.66k 浏览 0

微软发布最新开发的小型语言模型 Phi-2

Phi-2 仅有 2.7亿参数
Phi-2 超越了分别拥有7亿和13亿参数是Mistral和Llama-2模型
甚至在多步推理任务上超越了参数量是其25倍的Llama-2-70B模型
微软称Phi-2性能优异得益于其训练数据的质量非常高，他们弄了一个“教科书级”的数据集

“教科书级”的数据集：为了训练 Phi-2，研究团队创建了特定的数据集，这些数据集专门设计用来教授模型进行常识推理和理解一般知识。这些合成数据集可能包含各种情景和问题，旨在提高模型在处理现实世界问题时的准确性和可靠性。

知识迁移：另外研究团队还成功地将已经学习到的知识和模式从较小的Phi-1.5模型转移到了较大的Phi-2模型。这不仅提高了 Phi-2 的学习效率，还加速了其训练过程，使其能够更快地达到高水平的性能。

版权声明：除特殊说明外，本站所有文章均为字节点击原创内容，采用 BY-NC-SA 知识共享协议。原文链接：https://byteclicks.com/54764.html 转载时请以链接形式标明本文地址。转载本站内容不得用于任何商业目的。本站转载内容版权归原作者所有，文章内容仅代表作者独立观点，不代表字节点击立场。报道中出现的商标、图像版权及专利和其他版权所有的信息属于其合法持有人，只供传递信息之用，非商务用途。如有侵权，请联系 gavin@byteclicks.com。我们将协调给予处理。

微软发布最新开发的小型语言模型Phi-2

文章推荐：

标签