python-华为云modelarts的免费codelab运行chatglm2-6b-int4

10月前作者：liwulin0506 分类：Toy博客阅读(47) 违法举报

这篇具有很好参考价值的文章主要介绍了python-华为云modelarts的免费codelab运行chatglm2-6b-int4。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

前提：当前提供了8核64G的免费体验规格，每天三个小时限额
地址：https://console.huaweicloud.com/modelarts/?region=cn-north-4#/dashboard
下载模型：请参考另一个文章文章来源地址https://www.toymoban.com/news/detail-687875.html

创建环境（自带环境是pytorch1.8的，所以自己创建）

conda info --env

conda create --name pytorch2.0

conda activate pytorch2.0


安装必要的包

conda install pytorch torchvision torchaudio pytorch-cuda=11.7 -c pytorch -c nvidia

conda install pytorch torchvision torchaudio cpuonly -c pytorch

conda update -n base -c defaults conda

conda install transformers sentencepiece

pip install rouge_chinese cpm_kernels

运行代码

from transformers import AutoTokenizer, AutoModel

tokenizer = AutoTokenizer.from_pretrained("/home/ma-user/work/glm2/chatglm2-6b-int4", 
trust_remote_code=True)

model = AutoModel.from_pretrained("/home/ma-user/work/glm2/chatglm2-6b-int4",trust_remote_code=True).cuda()

model = AutoModel.from_pretrained("/home/ma-user/work/glm2/chatglm2-6b-int4",trust_remote_code=True).float()

model = model.eval()

response, history = model.chat(tokenizer, "晚上睡不着应该怎么办", history=[])

print(response)

到了这里，关于python-华为云modelarts的免费codelab运行chatglm2-6b-int4的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

LLaMa、Qwen、ChatGLM、ChatGLM2的区别

以下比较的前提是首先和BERT(transfomer)的对比感谢帮忙给我github repository的star，更多最新模型长期更新：https://github.com/zysNLP/quickllm LLaMa：去掉bias LayNorm方式：RMSnorm：https://zhuanlan.zhihu.com/p/650231190 torch自带LayerNorm ( F.layer_norm ) ：这是PyTorch库中内置的Layer Normalization实现。输入

2024年02月03日
浏览(46)
ChatGLM2-6B

ChatGLM2-6B 项目基本情况 GitHub：https://github.com/THUDM/ChatGLM2-6B/tree/main 参考：https://mp.weixin.qq.com/s/11jCCeOpg1YbABIRLlnyvg 主要贡献更强大的性能：基于 ChatGLM 初代模型的开发经验，我们全面升级了 ChatGLM2-6B 的基座模型。ChatGLM2-6B 使用了 GLM 的混合目标函数，经过了 1.4T 中英标识符的预

2024年02月15日
浏览(45)
ChatGLM2-6B 部署

这是ChatGLM2-6B 部署的阅读笔记，主要介绍了ChatGLM2-6B模型的部署和一些原理的简单解释。它是单卡开源的对话模型。充分的中英双语预训练较低的部署门槛 FP16半精度下，需要至少13G的显存进行推理，甚至可以进一步降低到10G(INT8)和6G(INT4) 更长的序列长度 ChatGLM-6B 序列长度达

2024年02月09日
浏览(54)
阿里云部署 ChatGLM2-6B 与 langchain+ChatGLM

更新系统安装git 克隆 ChatGLM2-6B 源码克隆 chatglm2-6b 模型安装 ChatGLM2-6B 依赖修改模型的路径修改成启动服务启动成功后克隆 langchain-ChatGLM 源码 git clone https://github.com/imClumsyPanda/langchain-ChatGLM.git 克隆模型安装 langchain-ChatGLM 依赖修改配置修改一修改成修改二修改成修改

2024年02月15日
浏览(50)
在矩池云使用ChatGLM-6B & ChatGLM2-6B

ChatGLM-6B 和 ChatGLM2-6B都是基于 General Language Model (GLM) 架构的对话语言模型，是清华大学 KEG 实验室和智谱 AI 公司于 2023 年共同发布的语言模型。模型有 62 亿参数，一经发布便受到了开源社区的欢迎，在中文语义理解和对话生成上有着不凡的表现。 ChatGLM-6B 可以在消费级的显卡

2024年02月14日
浏览(50)
AIGC - ChatGLM大模型：ChatGLM2-6B模型推理部署

如果你要问我为什么直接部署ChatGLM2的模型？因为当我在8月份在上海召开的全球人工智能大会上了解到清华-智谱发布的ChatGLM模型时，它已经发布了新的版本ChatGLM2，并且推理的效果提升了不少，那么本着只要最好的原则，我就直接上手先玩新版本了。作为AIGC方面的小白来说

2024年02月06日
浏览(48)
langchain调用chatGLM2纪实

一、科学上网要注意：域名全代和全局代理（网卡），都要打开。这样conda install特别快。二、安装langchain 1、 2、注意：使用pip install和conda install 是不同的二、简单运行一下

2024年02月13日
浏览(43)
ChatGLM2-6B下载与部署

我们首先来看一下 ChatGLM2-6B 模型的 requirements : 可以看到，要求 torch=2.0 ，这就产生了一个问题： torch 与 cuda 版本的匹配问题。本地机器中 CUDA=10.0 ，于是在费了半天时间配置好 ChatGLM2-6B 所需环境，从 github 和 huggingface 下载好了 ChatGLM2-6B 模型，但是在 run 的过程中报错 Torch

2024年02月06日
浏览(68)
ChatGLM2-6B github页面介绍

ChatGLM 2 -6B 是开源中英双语对话模型 ChatGLM-6B 的第二代版本，在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上，ChatGLM 2 -6B 引入了如下新特性：更强大的性能：基于 ChatGLM 初代模型的开发经验，我们全面升级了 ChatGLM2-6B 的基座模型。ChatGLM2-6B 使用了

2024年02月13日
浏览(47)
第五篇-ChatGLM2-6B模型下载

可以使用如下代码下载创建下载环境编写代码 down_glm2.py snapshot_download其他参数只允许下载部分类型的文件（以JSON为例） allow_patterns=‘*.json’, 不允许下载部分类型的文件（以JSON为例） ignore_patterns=[‘*.json’] 执行下第一篇-ChatGLM-webui-Windows安装部署-CPU版第二篇-二手工作站

2024年02月14日
浏览(78)