Google宣布辅助编程用的开放大模型CodeGemma

Heping 4月 10, 2024 2.99k 浏览 0

Google 近期发布了名为 CodeGemma 的辅助编程大模型，这一模型专门设计用于支持编程相关任务。

发布者与背景:
- Google 宣布了 CodeGemma 模型，将其作为一款面向编程辅助的开放大模型。
- CodeGemma 建立在 Google 早先发布的轻量级开放大模型 Gemma 的基础上。
模型规模:
- CodeGemma 提供了两种不同的参数规模版本，分别对应 Gemma 的不同大小：
  - CodeGemma 2B: 基于 Gemma 2B 参数规模构建。
  - CodeGemma 7B: 基于 Gemma 7B 参数规模构建。
可用性与分发:
- 用户可以直接在知名机器学习模型库 Hugging Face 上下载 CodeGemma 的模型权重，这意味着开发者和研究人员可以方便地访问并集成该模型到自己的项目中。
训练与优化:
- CodeGemma 实施了 预训练 和 指令微调 两种策略，以提升其在编程任务上的性能：
  - 预训练：模型首先在大规模编程相关数据集上进行无监督或自监督学习，以捕获编程语言的通用结构、语法和语义特征。
  - 指令微调：进一步针对特定编程辅助任务（如代码补全、代码生成、代码解释、编程问题解答等）进行有监督的微调，使模型能更精准地响应用户输入的指令或需求。

CodeGemma 是 Google 推出的一款专为编程辅助场景优化的大规模语言模型，它基于先前的轻量级模型 Gemma，并提供两种不同参数规模的选择以适应不同资源需求和性能要求。通过在 Hugging Face 上公开模型权重，CodeGemma 旨在促进编程工具开发、代码生成研究以及实际编程工作中的广泛应用，使用者可以利用其预训练和指令微调的优势来提高编程效率和代码质量。

版权声明：除特殊说明外，本站所有文章均为字节点击原创内容，采用 BY-NC-SA 知识共享协议。原文链接：https://byteclicks.com/57342.html 转载时请以链接形式标明本文地址。转载本站内容不得用于任何商业目的。本站转载内容版权归原作者所有，文章内容仅代表作者独立观点，不代表字节点击立场。报道中出现的商标、图像版权及专利和其他版权所有的信息属于其合法持有人，只供传递信息之用，非商务用途。如有侵权，请联系 gavin@byteclicks.com。我们将协调给予处理。

Google宣布辅助编程用的开放大模型CodeGemma

文章推荐：

标签