AIGC - ChatGLM大模型：ChatGLM2-6B模型推理部署

7月前作者：有意思科技分类：Toy博客阅读(35) 违法举报

这篇具有很好参考价值的文章主要介绍了AIGC - ChatGLM大模型：ChatGLM2-6B模型推理部署。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

前言

如果你要问我为什么直接部署ChatGLM2的模型？

因为当我在8月份在上海召开的全球人工智能大会上了解到清华-智谱发布的ChatGLM模型时，它已经发布了新的版本ChatGLM2，并且推理的效果提升了不少，那么本着只要最好的原则，我就直接上手先玩新版本了。

模型简介

AIGC - ChatGLM大模型：ChatGLM2-6B模型推理部署,人工智能,AIGC,AIGC,人工智能,pytorch

AIGC - ChatGLM大模型：ChatGLM2-6B模型推理部署,人工智能,AIGC,AIGC,人工智能,pytorch

部署的环境

作为AIGC方面的小白来说，我抱着非常天真的想法，想让它在我的工作笔记本上用i5的CPU去跑，至于为什么这么想，当然是因为我没有GPU，身边也没有其他的带显卡电脑

AIGC - ChatGLM大模型：ChatGLM2-6B模型推理部署,人工智能,AIGC,AIGC,人工智能,pytorch

恰好，在腾讯云看到了GN7的显示优惠活动，60块钱15天，Nvidia T4的AI卡，直接斥巨资购买了15天

AIGC - ChatGLM大模型：ChatGLM2-6B模型推理部署,人工智能,AIGC,AIGC,人工智能,pytorch

并且为了方便访问模型资源，我这里选择了新加坡的节点

AIGC - ChatGLM大模型：ChatGLM2-6B模型推理部署,人工智能,AIGC,AIGC,人工智能,pytorch

软件环境

腾讯云的服务器，我选择了自己常用ubuntu镜像，同时此模型都是基于python语言，pytorch框架训练的模型，为了便于管理python版本库，使用anaconda来管理。

具体软件环境版本如下：

conda 4.8.2

python 3.9

pytorch2.0.1

cuda 11.7

AIGC - ChatGLM大模型：ChatGLM2-6B模型推理部署,人工智能,AIGC,AIGC,人工智能,pytorch

具体的软件环境搭建过程，另起一篇去记录

代码工程及模型准备

1. github工程准备

git clone https://github.com/THUDM/ChatGLM2-6B.git

下载完后，进入到工程目录下需要执行 pip install -r requirements.txt 安装需要的依赖

AIGC - ChatGLM大模型：ChatGLM2-6B模型推理部署,人工智能,AIGC,AIGC,人工智能,pytorch

2. 模型权重准备

模型权重一般在huggingface上，但是现在huggingface被墙了，国内的同学需要科学上网才行，这里国内的小伙伴推荐去国内的modelscope下载模型权重

AIGC - ChatGLM大模型：ChatGLM2-6B模型推理部署,人工智能,AIGC,AIGC,人工智能,pytorch

下载前需要安装git-lfs

sudo apt-get install git-lfs

使用git下载：

git lfs clone https://www.modelscope.cn/ZhipuAI/chatglm2-6b.git

AIGC - ChatGLM大模型：ChatGLM2-6B模型推理部署,人工智能,AIGC,AIGC,人工智能,pytorch

运行

1.修改运行脚本cli_demo.sh

将模型路径修改为本地路径，即刚刚从modelscope下载的

AIGC - ChatGLM大模型：ChatGLM2-6B模型推理部署,人工智能,AIGC,AIGC,人工智能,pytorch

2.运行推理

跑一个命令行的对话

python cli_demo.py

AIGC - ChatGLM大模型：ChatGLM2-6B模型推理部署,人工智能,AIGC,AIGC,人工智能,pytorch

同时，官方也提供了网页版的web_demo,同样只需要修改模型路径为本地即可

体验

AIGC - ChatGLM大模型：ChatGLM2-6B模型推理部署,人工智能,AIGC,AIGC,人工智能,pytorch 文章来源地址https://www.toymoban.com/news/detail-735557.html

到了这里，关于AIGC - ChatGLM大模型：ChatGLM2-6B模型推理部署的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

LLMs之ChatGLM2：ChatGLM2-6B本地部署之单机推理(API/CLI/GUI)、低成本部署(GPU量化部署/CPU及其量化部署/Mac部署/多卡部署)、有限资源下高效微调(全参/P-t

LLMs之ChatGLM2：ChatGLM2-6B本地部署之单机推理(API/CLI/GUI)、低成本部署(GPU量化部署/CPU及其量化部署/Mac部署/多卡部署)、有限资源下高效微调(全参/P-tuning v2)、模型评估和推理之图文教程之详细攻略目录一、配置基础环境及其注意事项第一步、检测软硬件环境

2024年02月07日
浏览(34)
ChatGLM2-6B：性能大幅提升，8-32k上下文，推理提速42% —— 开源中英双语对话模型 ChatGLM-6B 的第二代来了！更强大的性能，更长的上下文，更高效的推理，更开放的协议！

2023年10月31日
浏览(49)
本地部署ChatGLM-6B模型（使用JittorLLMs大模型推理库）

网上冲浪时发现的这两个国产模型，重点是对硬件的要求并不高，有2GB内存就可以跑，觉得有趣就弄来玩了下。 https://github.com/Jittor/JittorLLMs https://github.com/THUDM/ChatGLM-6B 简单介绍下用到的仓库 ChatGLM-6B ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型，基于 General Language

2024年02月01日
浏览(42)
chatglm2-6b模型在9n-triton中部署并集成至langchain实践

近期， ChatGLM-6B 的第二代版本ChatGLM2-6B已经正式发布，引入了如下新特性： ①. 基座模型升级，性能更强大，在中文C-Eval榜单中，以51.7分位列第6； ②. 支持8K-32k的上下文； ③. 推理性能提升了42%； ④. 对学术研究完全开放，允许申请商用授权。目前大多数部署方案采用的是

2024年02月12日
浏览(67)
人工智能_CPU安装运行ChatGLM大模型_安装清华开源人工智能AI大模型ChatGlm-6B_004---人工智能工作笔记0099

上一节003节我们安装到最后,本来大模型都可以回答问题了,结果, 5分钟后给出提示,需要GPU,我去..继续看官网,如何配置CPU运行没办法继续看: 这里是官网可以看到需要gcc的版本是11.3.0,这里我们先没有去安装,直接试试再说 yum install epel-release yum install gcc-11.3.0 安装的话执行这

2024年02月21日
浏览(49)
清华大学开源ChatGLM2-6B开源模型在anaconda下的虚拟环境详细部署及安装教程

python版本要求：3.8以上没有安装python的没有关系，我们在下面安装anaconda中会自动生成python，有了python的建议删除，通过anaconda安装python以便于后面创建虚拟环境。 windows系统：Windows 10 以上，推荐N卡（NVIDIA显卡20系列以上）注意：处理器为AMD容易报错，intel的不容易报错，配

2024年02月16日
浏览(64)
chatglm2-6b模型在9n-triton中部署并集成至langchain实践 | 京东云技术团队

近期， ChatGLM-6B 的第二代版本ChatGLM2-6B已经正式发布，引入了如下新特性： ①. 基座模型升级，性能更强大，在中文C-Eval榜单中，以51.7分位列第6； ②. 支持8K-32k的上下文； ③. 推理性能提升了42%； ④. 对学术研究完全开放，允许申请商用授权。目前大多数部署方案采用的是

2024年02月12日
浏览(37)
ChatGLM2-6B 部署

这是ChatGLM2-6B 部署的阅读笔记，主要介绍了ChatGLM2-6B模型的部署和一些原理的简单解释。它是单卡开源的对话模型。充分的中英双语预训练较低的部署门槛 FP16半精度下，需要至少13G的显存进行推理，甚至可以进一步降低到10G(INT8)和6G(INT4) 更长的序列长度 ChatGLM-6B 序列长度达

2024年02月09日
浏览(42)
【AI】RTX2060 6G Ubuntu 22.04.1 LTS (Jammy Jellyfish) 部署chatglm2-6b 开源中英双语对话模型

项目地址 chatglm2-6b 下载模型创建测试项目创建虚拟环境安装依赖完整的venv环境 main.py 执行 python进程cpu使用率100.3%持续了很长时间，没有启用多线程？

2024年01月20日
浏览(39)
ChatGLM2-6B下载与部署

我们首先来看一下 ChatGLM2-6B 模型的 requirements : 可以看到，要求 torch=2.0 ，这就产生了一个问题： torch 与 cuda 版本的匹配问题。本地机器中 CUDA=10.0 ，于是在费了半天时间配置好 ChatGLM2-6B 所需环境，从 github 和 huggingface 下载好了 ChatGLM2-6B 模型，但是在 run 的过程中报错 Torch

2024年02月06日
浏览(49)