【ChatGLM】大模型之 ChatGLM 部署

这篇具有很好参考价值的文章主要介绍了【ChatGLM】大模型之 ChatGLM 部署。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目录

1. 资源下载

2. 部署启动


1. 资源下载

  • HuggingFace 模型权重下载
# install git-lfs
git lfs install  

# download checkpoint
# clone the repo
git clone https://huggingface.co/THUDM/chatglm-6b
  • 手动模型权重下载
# download checkpoint 
# clone the repo, skip large files, large files need to download separately
GIT_LFS_SKIP_SMUDGE=1 git clone https://huggingface.co/THUDM/chatglm-6b
# download large files from thu cloud
git clone https://github.com/chenyifanthu/THU-Cloud-Downloader.git
cd THU-Cloud-Downloader/
python main.py \
--link https://cloud.tsinghua.edu.cn/d/fb9f16d6dc8f482596c2/ \
--save ../chatglm-6b
  • 源码下载
# clone source code
git clone https://github.com/THUDM/ChatGLM-6B.git
cd ChatGLM2-6B
pip install -r requirements.txt

2. 部署启动

  • 源码修改

对于 `cli_demo.py` 和 `web_demo.py` 中模型加载部分需要从 HuggingFace 下载

tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True)
model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).half().cuda()

改为从本地加载

tokenizer = AutoTokenizer.from_pretrained("../chatglm-6b", trust_remote_code=True)
model = AutoModel.from_pretrained("../chatglm-6b", trust_remote_code=True).half().cuda()
  • 命令行启动
# command line (specify model path)
python cli_demo.py
  • 网页启动
# web by Gradio (specify model path)
python web_demo.py

启动后的效果:

【ChatGLM】大模型之 ChatGLM 部署,LLM,人工智能,语言模型文章来源地址https://www.toymoban.com/news/detail-632181.html

到了这里,关于【ChatGLM】大模型之 ChatGLM 部署的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包