好望角:让你的每次点击都有价值:byteclicks.com | 搜索引擎正在被AI污染信息源，中文优质信息越来越少了 |

首页 > 人工智能 | 最前沿 > NVIDIA开源3400亿参数模型Nemotron-4 340B

NVIDIA开源3400亿参数模型Nemotron-4 340B

Heping 6月 19, 2024 4.36k 浏览 0

美国英伟达公司宣布开源Nemotron-4 340B（3400亿参数）系列模型。Nemotron-4 340B包括基础模型Base、指令模型Instruct和奖励模型Reward，并构建了一个高质量合成数据生成的完整流程。模型支持4K上下文窗口、50多种自然语言和40多种编程语言，训练数据截止到2023年6月。训练数据方面，英伟达采用了高达9万亿个token。其中，8万亿用于预训练，1万亿用于继续训练以提高质量。指令模型的训练是在98%的合成数据上完成的。据英伟达介绍，开发人员可使用该系列模型生成合成数据来训练大语言模型，用于医疗保健、金融、制造、零售和其他行业的商业应用。

主要信息

模型家族介绍：Nemotron-4 340B模型家族包括三个子模型，分别是Base、Instruct和Reward版本。
开源许可：这些模型在NVIDIA开放模型许可协议下开放使用，允许分发和修改。
性能表现：在多个评估基准上表现优异，适合在单个DGX H100上部署。
合成数据生成：模型对齐过程中98%以上的数据为合成生成，展示其生成能力。
支持开放研究：开源合成数据生成管道，促进研究和模型开发。

版权声明：除特殊说明外，本站所有文章均为字节点击原创内容，采用 BY-NC-SA 知识共享协议。原文链接：https://byteclicks.com/60390.html 转载时请以链接形式标明本文地址。转载本站内容不得用于任何商业目的。本站转载内容版权归原作者所有，文章内容仅代表作者独立观点，不代表字节点击立场。报道中出现的商标、图像版权及专利和其他版权所有的信息属于其合法持有人，只供传递信息之用，非商务用途。如有侵权，请联系 gavin@byteclicks.com。我们将协调给予处理。

上一篇: 科学家利用“数据+知识+AI”实现新靶标药物虚拟筛选

下一篇: 盖茨基金会支持的千脑计划正式启动开发类脑人工智能

文章推荐：

美国NIST正完善人工智能风险框架 2021-08-03

福布斯：2022年人工智能领域发展七大趋势 2021-12-23

你的私人AI项目经理已上线，你准备好了吗？ 2024-03-12

Meta超级人工智能团队详细名单一半来自中国 2025-07-20

美国防部尝试通过人工智能工具预测未来事件 2021-08-04

俄罗斯联合发动机制造集团使用人工智能技术生产雅克-130飞机发动机 2020-06-28

标签