StarCoder
BigCode 开发的 StarCoder,这是一个在一万亿的 token、80 多种编程语言上训练过的 16B 参数量的模型。训练数据多来自 GitHub 上的 issues、使用 Git 提交的代码、Jupyter Notebook 等等 。得益于对企业友好的许可证、长度为 8192 的 token、借助 multi-query attention 的快速大批量推理,StarCoder 可以说是当前对代码相关的应用最合适的开源选择。文章来源:https://www.toymoban.com/news/detail-852894.html
- 代码: https://github.com/bigcode-project/starcoder
- 数据集: https://huggingface.co/datasets/HuggingFaceH4/oasst1_en
- 模型: https://huggingface.co/HuggingFaceH4/starchat-alpha
调优
$ git clone https://github.com/bigcode-project/starcoder.git
$ cd starcoder/chat
创建环境文章来源地址https://www.toymoban.com/news/detail-852894.html
到了这里,关于[算法前沿]--022-使用 StarCoder 创建一个编程助手的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!