chatglm——从部署到训练全流程&&你遇到的错误都在这里。

这篇具有很好参考价值的文章主要介绍了chatglm——从部署到训练全流程&&你遇到的错误都在这里。。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

自然语言训练似乎一夜之间就被chatgpt带火了。而因为我们需要做自然语言训练开发,所以就找了清华大学的chatglm来开发。在部署中我们遇到了很多的问题,当然也是各种百度去解决。最终功夫不负有心人,我们尝试了各种方法,完成了整体的训练。下面我就把完整的流程和你肯定会遇到的错误提示一一写明修改方式。

一、环境
1、首先不推荐华为的免费试用空间,那个空间不支持cuda,所以说运行的时候会报找不到libcuda.so.1,这个错误解决不了。
2、我用的是阿里云的PAI环境,阿里云是有免费的探索者版,但是探索者版能做到的,最多就是告诉你这个代码能不能跑。可以训练,但是4g的内存太小了,训练数据直接就干炸了。
首先在阿里云要先创建一个DSW,选择ecs.gn7i-c8g1.2xlarge即可,最重要的是,在官方镜像中,一定要选择pytorch,py39版本的。否则是无法运行numba的。
chatglm——从部署到训练全流程&&你遇到的错误都在这里。
3、创建好了之后,需要等待很长一段时间准备环境。
4、进入之后,新建一个Terminal,然后输入
git clone https://github.com/THUDM/ChatGLM-6B,然后会生成一个ChatGLM-6B文件夹。
5、打开文件夹,有一个requirements.txt文件,右键点击,选择copy path(这个操作会经常用到,我会简称cp一下)。在命令行输入:pip install -r ctv(ctv为ctrl+v,粘贴一下cp的内容),回车。会安装好。之后再pip install四个文件:

pip install jieba
pip install rouge_chinese
pip install nltk
pip install datasets

6、在根目录建一个文件夹,名称training。这个我们留着后面用到。
7、打开ChatGLM-6B中ptuning文件夹,里面有两个文件非常重要,一个是train.sh,一个是main.py入口文件。
8、打开train.py文件,我们要修改几个东西:
① 首先把python3改成python,这里如果不修改,你会遇到找不到numpy的报错;
② cp一下main.py,把python后面的main.py改成cp的内容,粘贴一下;
③ train_file和validation_file是你要训练的文件的路径,这就是第三大步在根目录建的training的原因。
这三步做完,保存退出。
chatglm——从部署到训练全流程&&你遇到的错误都在这里。
9、这时候开始写你需要训练的文件。首先先说训练文件必须是json格式,“content”是输入的问题,“summary”是输出的内容。但是这里我们要注意第二个问题,就是我们在本地用dict[key]=value的形式写成字典的时候,返回的值是单引号的,这时候一定要改成双引号。比如{“content”:“1”,“summary”:“2”},而不是{‘content’:‘1’,‘summary’:‘2’}。最后将文件保存成.json格式。然后在数据中,如果有\n\r的也是无法被json的。
10、把文件传到training目录下,cp一下路径,将train.sh文件中train_file和validation_file后面改为cp的路径。
11、这时候返回Terminal,cp一下train.sh,输入

bash cp路径/train.sh

即可启动训练。
chatglm——从部署到训练全流程&&你遇到的错误都在这里。
对于windows系统,最难的也是环境配置,这里再重申一遍硬件配置:
python:3.9
内存最低:16g
显存最低:16g
硬盘一定是固态硬盘。文章来源地址https://www.toymoban.com/news/detail-461598.html

到了这里,关于chatglm——从部署到训练全流程&&你遇到的错误都在这里。的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 29K star!关于shell,你需要的都在这里

    Awesome 是GitHub上一个神奇的单词,搜索Awesome可以发现非常多精彩的汇总性项目,涉及到各种方面,而且star都非常多。 今天我们推荐的开源项目帮你整理了玩转shell所需的一切,本项目目前在GitHub已超过29K Star,它就是:awesome-shell。 awesome-shell 是一个精选的资源列表,里面包括

    2024年01月17日
    浏览(48)
  • 耐克玩转Web3的秘诀都在这里了

    最近几年兴起的Web3技术给许多传统企业带来了新的启发,这其中不乏一些全球商业巨头。耐克公司作为当今年轻一代的文化偶像,自然不会错过尝新的机会。这家运动休闲领域巨头在去年年底推出了名为“耐克乐园”(NIKELAND)的虚拟体验之后,又迅速收购了NFT工作室RTFKT,

    2023年04月08日
    浏览(39)
  • msyql 异常,别干着急,70%的问题都在这里!

    性能测试中,数据库的性能问题,可能会占到 70%,所以讲性能测试,数据库是一个非常非常重要的知识。但是,最近在讲 MySQL 数据库的时候,却遇到了一个尴尬。 之前的小伙伴是需要手动安装 MySQL 数据库的,虽然,安装方法很多,但是,使用 yum 命令来安装,又是每个同学

    2024年01月17日
    浏览(321)
  • 铸博皇御:想了解的贵金属点差都在这里

    如今,越来越多的人希望通过投资理财赚取更多的钱,但是无论如何,投资者在开始交易之前都要学习相关的专业知识,了解贵金属投资市场,以及投资中的交易细节,如贵金属点差、合约单位等。这里着重介绍贵金属点差是什么,它在贵金属投资中又扮演着什么样的角色。

    2023年04月24日
    浏览(46)
  • 别找了!前端那些好用的网站都在这里了!【文末送书】

    好用的网站千千万万,如果你还发现好用的网站,欢迎在评论区中留言分享😁, 赠书活动在 文末 哟,中奖者可以从给出的五本书中任意挑选自己喜欢的那本 文章目录 🍀前言 🍀一、渐变神器Gradient 🍀二、两款阴影工具在线网站 🍀三、网站UI配色宝藏网站UI Design Daily 🍀四

    2024年02月08日
    浏览(317)
  • Java中关于内存泄漏分析和解决方案,都在这里了!

    最近正在熟悉Java内存泄漏的相关知识,上网查阅了一些资料,在此做个整理算是对收获的一些总结,希望能对各位有所帮助,有问题可以文末留言探讨、补充。 如下是整篇文章的结构,所需阅读时间大约20min 内存泄漏 :对象已经没有被应用程序使用,但是垃圾回收器没办法

    2024年02月13日
    浏览(44)
  • AI破局俱乐部,你要了解的都在这里

    您好,我是码农飞哥(wei158556),感谢您阅读本文,欢迎一键三连哦 。 💪🏻 1. Python基础专栏,基础知识一网打尽,9.9元买不了吃亏,买不了上当。 Python从入门到精通 😁 2. 毕业设计专栏,毕业季咱们不慌忙,几百款毕业设计等你选。 ❤️ 3. Python爬虫专栏,系统性的学习

    2024年02月21日
    浏览(69)
  • 关于汽车信息安全,你想了解的知识点都在这里!

    随着车联网高速发展,汽车智能化、网联化不断加强,汽车信息安全面临着全新的挑战。如果汽车没有得到更好的安全防护,受到的恶意攻击可能增多。因此,打造更坚固的车载信息安全防护尤为重要。 那么,汽车信息安全都面临哪些威胁与挑战呢?提升汽车抗攻击能力的安

    2024年02月07日
    浏览(42)
  • 模型训练系列:1、用清华ChatGLM-6B模型部署自己的本地AI助手

    最近清华大学开源的ChatGLM-6B语言模型在国际上大出风头,仅仅62亿参数的小模型,能力却很强。很期待他们后续1300亿参数模型130B的发布。 为什么一些能力较弱的小模型,这么受追捧?因为ChatGPT、GPT-4虽好,毕竟被国外封锁,而且还要付费,更重要的是,LLM要在各行业提高生

    2024年02月11日
    浏览(52)
  • ubuntu 部署 ChatGLM-6B 完整流程 模型量化 Nvidia

    ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。 ChatGLM-6B 使用了和 ChatGPT 相似的技术,针对中文问答和对话进行了优

    2024年02月13日
    浏览(37)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包