【AI实战】开源可商用的中英文大语言模型baichuan-7B,从零开始搭建

这篇具有很好参考价值的文章主要介绍了【AI实战】开源可商用的中英文大语言模型baichuan-7B,从零开始搭建。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

【AI实战】开源可商用的中英文大语言模型baichuan-7B,从零开始搭建

baichuan-7B 简介

baichuan-7B 是由百川智能开发的一个开源可商用的大规模预训练语言模型。基于 Transformer 结构,在大约1.2万亿 tokens 上训练的70亿参数模型,支持中英双语,上下文窗口长度为4096。在标准的中文和英文权威 benchmark(C-EVAL/MMLU)上均取得同尺寸最好的效果。

  • GitHub:
    https://github.com/baichuan-inc/baichuan-7B

  • Hugging Face:
    https://huggingface.co/baichuan-inc/baichuan-7B/tree/main

baichuan-7B 中文评测

  • C-Eval
    【AI实战】开源可商用的中英文大语言模型baichuan-7B,从零开始搭建

  • Gaokao
    【AI实战】开源可商用的中英文大语言模型baichuan-7B,从零开始搭建

baichuan-7B 搭建

  • 1、拉取docker镜像

    docker pull nvcr.io/nvidia/pytorch:21.08-py3
    

    【】需要 cuda 11.1 及以上版本

  • 2、创建docker

    nvidia-docker run -it -d \
        --name baichuan_llm \
        -v /llm:/notebooks \
        -e TZ='Asia/Shanghai' \
        --shm-size 16G \
        nvcr.io/nvidia/pytorch:21.08-py3
    

    进入容器内:

    docker exec -it baichuan_llm env LANG=C.UTF-8 /bin/bash
    
  • 3、下载代码

    cd /notebooks/
    git clone https://github.com/baichuan-inc/baichuan-7B.git
    
  • 4、下载模型权重文件

    cd baichuan-7B/
    git clone https://huggingface.co/baichuan-inc/baichuan-7B
    
  • 5、按照依赖库

    pip install -r requirements.txt
    
  • 6、推理

    from transformers import AutoModelForCausalLM, AutoTokenizer
    
    tokenizer = AutoTokenizer.from_pretrained("baichuan-7B", trust_remote_code=True)
    model = AutoModelForCausalLM.from_pretrained("baichuan-7B", device_map="auto", trust_remote_code=True)
    inputs = tokenizer('登鹳雀楼->王之涣\n夜雨寄北->', return_tensors='pt')
    inputs = inputs.to('cuda:0')
    pred = model.generate(**inputs, max_new_tokens=64,repetition_penalty=1.1)
    print(tokenizer.decode(pred.cpu()[0], skip_special_tokens=True))
    
    • 输出

      【AI实战】开源可商用的中英文大语言模型baichuan-7B,从零开始搭建

  • 7、训练

    • 准备数据
      用户将训练语料按总rank数的倍数均匀切分成多个 UTF-8 文本文件,放置在语料目录(默认为 data_dir )下。各个rank进程将会读取语料目录下的不同文件,全部加载到内存后,开始后续训练过程。以上是简化的示范流程,建议用户在正式训练任务中,根据需求调整数据生产逻辑。

    • 配置 DeepSpeed
      修改 config/hostfile ,如果是多机多卡,需要修改 ssh 中各个节点的 IP 配置。

    • 训练

      sh scripts/train.sh
      

参考

https://huggingface.co/baichuan-inc/baichuan-7B/tree/main
https://github.com/baichuan-inc/baichuan-7B文章来源地址https://www.toymoban.com/news/detail-490879.html

到了这里,关于【AI实战】开源可商用的中英文大语言模型baichuan-7B,从零开始搭建的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 秘塔写作猫:一款交互式中英文AI写作辅助平台

    秘塔写作猫基于人工智能技术,可以快速地对海量数据进行采集和分析处理,生成丰富多样的文章内容。其AI写作能力强大,不仅可以进行翻译与改错,还具有改写功能,能够根据用户需求对语句结构、段落层次、关键信息等多种因素进行综合分析,自动生成改写内容,使文

    2024年04月28日
    浏览(100)
  • 【AI实战】开源且可商用的 40B 大语言模型 Falcon 40B

    官网 https://www.tii.ae/news/uaes-technology-innovation-institute-launches-open-source-falcon-40b-large-language-model Abu Dhabi-UAE: 25 May, 2023 – The Technology Innovation Institute (TII), a leading global scientific research center and the applied research pillar of Abu Dhabi’s Advanced Technology Research Council (ATRC), today strengthened its gro

    2024年02月07日
    浏览(44)
  • 大模型部署手记(10)LLaMa2+Chinese-LLaMA-Plus-7B+Windows+llama.cpp+中英文对话

    组织机构:Meta(Facebook) 代码仓:GitHub - facebookresearch/llama: Inference code for LLaMA models 模型:llama-2-7b、llama-2-7b-chat( 后来证明无法实现中文转换 )、Chinese-LLaMA-Plus-7B(chinese_llama_plus_lora_7b)   下载:使用download.sh下载 硬件环境:暗影精灵7Plus Windows版本:Windows 11家庭中文版

    2024年02月04日
    浏览(54)
  • Android安卓实战项目(12)—关于身体分析,BMI计算,喝水提醒,食物卡路里计算APP【支持中英文切换】生活助手类APP(源码在文末)

    B站演示 【Android安卓实战项目(12)—生活助手类APP—关于身体分析,BMI计算,喝水提醒,食物卡路里计算APP【支持中英文切换】】 https://www.bilibili.com/video/BV1Wu4y1C76j/?share_source=copy_webvd_source=b2e9b9ed746acda34f499009647748ed 这段代码是一个Android应用程序的主要活动(Activity),它是一

    2024年02月10日
    浏览(43)
  • OpenAI-ChatGPT最新官方接口《AI绘图》全网最详细中英文实用指南和教程,助你零基础快速轻松掌握全新技术(三)(附源码)

    Learn how to generate or manipulate images with our DALL·E models 了解如何使用我们的DALL·E模型生成或操作图像 ChatGPT不仅仅是一个强大的自然语言处理模型,其DALL·E模型还可以帮助用户快速生成多种多样的图像。用户可以根据文字快速生成图片,即可自动生成出特定的图片,大大提高了

    2024年02月02日
    浏览(53)
  • OpenAI-ChatGPT最新官方接口《微调ChatGPT模型》全网最详细中英文实用指南和教程,助你零基础快速轻松掌握全新技术(四)(附源码)

    Fine-tuning 微调模型 Learn how to customize a model for your application. 了解如何为应用程序自定义模型。 ChatGPT可以帮助用户使用自己的语料集来训练出一个更加适用于用户使用场景的准确、可靠的自然语言模型。 ChatGPT的微调模型技术主要通过将先前预训练过的语言模型(如GPT-3.5)作

    2024年02月04日
    浏览(70)
  • Vray中英文对照

    渲染元素,中英文对照表 【英文】 【中文翻译】 VRayAlpha VRay Alpha VRayAO VRay AO VRayDRBucket VRay DR 渲染块 VRayMtlReflectIOR VRay Mtl 反射IOR VRayMtlReflectHilightGlossiness VRay Mtl 反射高光光泽度 VRayMtlReflectGlossiness VRay Mtl 反射光泽度 VRayMtlRefractGlossiness VRay Mtl 折射光泽度 VRayZDepth VRay Z 深度 VR

    2024年02月05日
    浏览(57)
  • Qt 动态中英文切换

            需要界面实现动态国际化,一键点击切换中英文或其他语言。         已经完成了整个界面的翻译,拿到匹配的ts翻译文件,注意:要保证界面切换后,翻译的全覆盖,要保证任何需要反应的地方,都用到了tr(\\\"\\\")包含,不然Linguist会捕捉不到。.ts文件的生成参考下文

    2024年02月10日
    浏览(76)
  • 网络安全中英文术语大全

    01享级持久感动(APT) 一种阿络攻击。使用复杂的技术持续对目标 政府和公司进行网络间谍活造或其他咨意活 动。遗常由具有丰富专业知识和大量安渗的 对手进行-通营与民族国家参与者相关。 这些攻击往往来自多个入口点,并且可能使 用多个攻击媒介 《例运,同络攻击,

    2024年02月05日
    浏览(60)
  • 汽车研发与制造中英文对照

    FPDS(Ford Product Development System)福特产品开发系统 threetype chassis 三类底盘 inter-citybus 长途客车 PassengerVehicle 乘用车 MPV(Multi-PurposeVehicle)多用途汽车 SUV(Sports Utility Vehicle) 运动型多用途车 four-wheeldrive 四轮驱动 front-wheeldrive 前轮驱动 DFA-Design For Assembly 面向装配的设计 toolb

    2024年02月21日
    浏览(73)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包