CodeGemma

CodeGemma 是功能强大的轻量级模型集合,可以执行各种编码任务,例如填充中间代码补全、代码生成、自然语言理解、数学推理和指令遵循。

CodeGemma 有 3 个模型变体:

  • 一种 7B 预训练变体,专门用于补全代码以及利用代码前缀和/或后缀生成代码
  • 70 亿个指令微调变体,用于自然语言到代码的聊天和指令遵循
  • 一种先进的 2B 预训练变体,代码补全速度快至 2 倍
  • CodeGemma 模型具有多项优势:

  • 无论您是在本地工作,还是使用 Google Cloud 资源,都可以填写整行、函数,甚至生成整块代码块。
  • CodeGemma 模型基于 Web 文档、数学和代码中的 5000 亿个词元(主要是英语)数据训练而成,生成的代码不仅语法正确,而且语义上也更有意义,从而减少错误并缩短调试时间。
  • 支持 Python、JavaScript、Java、Kotlin、C++、C#、Rust、Go 和其他语言。
  • 将 CodeGemma 模型集成到开发环境中,可以减少编写样板代码的工作量,更快地专注于有趣且与众不同的代码。

其他资源

CodeGemma 的模型卡片包含有关模型的详细信息、实现信息、评估信息、模型使用情况和限制等。
在 Kaggle 上查看有关 CodeGemma 的更多代码、Colab 笔记本、信息和讨论。