书生·浦语大模型实战营第五节课笔记及作业

10月前作者：zpc1219 分类：Toy博客阅读(38) 违法举报

这篇具有很好参考价值的文章主要介绍了书生·浦语大模型实战营第五节课笔记及作业。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

LMDeploy 大模型量化部署实践

1 大模型部署背景

1.1 模型部署及大模型特点

书生·浦语大模型实战营第五节课笔记及作业,笔记

1.2 大模型部署挑战及方案

书生·浦语大模型实战营第五节课笔记及作业,笔记

2 LMDeploy简介

书生·浦语大模型实战营第五节课笔记及作业,笔记

2.1 核心功能-量化

书生·浦语大模型实战营第五节课笔记及作业,笔记

2.2 核心功能-推理引擎TurboMind

书生·浦语大模型实战营第五节课笔记及作业,笔记

2.1 核心功能-推理服务api server

书生·浦语大模型实战营第五节课笔记及作业,笔记

3 动手实践及作业

按照文档LMDeploy 的量化和部署中的步骤在InternStudio中的 A100(1/4) 机器上一步步操作即可！

3.1 基础作业

使用 LMDeploy 以本地对话、网页Gradio、API服务中的一种方式部署 InternLM-Chat-7B 模型，生成 300 字的小故事（需截图）

3.1.1 本地对话形式

书生·浦语大模型实战营第五节课笔记及作业,笔记

3.1.2 API服务形式

书生·浦语大模型实战营第五节课笔记及作业,笔记

书生·浦语大模型实战营第五节课笔记及作业,笔记

3.1.3 网页Gradio形式

TurboMind 服务作为后端:
书生·浦语大模型实战营第五节课笔记及作业,笔记

TurboMind 推理作为后端
书生·浦语大模型实战营第五节课笔记及作业,笔记

参考文献：

1、文档：LMDeploy 的量化和部署
2、视频：LMDeploy 大模型量化部署实践文章来源地址https://www.toymoban.com/news/detail-805078.html

到了这里，关于书生·浦语大模型实战营第五节课笔记及作业的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

书生·浦语大模型--第三节课笔记--基于 InternLM 和 LangChain 搭建你的知识库

LLM的局限性：时效性（最新知识）、专业能力有限（垂直领域）、定制化成本高（个人专属）两种开发范式： RAG（检索增强生成）：外挂知识库，首先匹配知识库文档，交给大模型。优势：成本低，实时更新，不需要训练。但受限于基座模型，知识有限，总结性回答不佳。

2024年01月18日
浏览(51)
书生·浦语大模型实战营:Ch1-书生·浦语大模型全链路开源体系

视频链接：(1)书生·浦语大模型全链路开源体系_哔哩哔哩_bilibili 以语言模型和大语言模型为的检索记录呈指数级上升；以ChatGPT为代表的大语言模型技术成果引起了广泛的使用兴趣。深度学习与强化学习模型在许多特定领域建立了许多富有成效的专用模型，用于解决特

2024年02月01日
浏览(54)
书生.浦语大模型实战一

从专用模型到通用大模型书生.万卷1.0 文本图像-文本视频数据 OpenDataLab开放平台图像：ImageNet tokens语料：WikiQA 音频视频：MovieNet 3D模型增量续训使用场景：让基座模型学习到一些新知识，如某个垂类领域知识训练数据：文章、书籍、代码等有监督微调使用场景：让模型

2024年01月16日
浏览(49)
《书生·浦语大模型全链路开源开放体系》第五课作业 LMDeploy 的量化和部署

使用 LMDeploy 以本地对话、网页Gradio、API服务中的一种方式部署 InternLM-Chat-7B 模型，生成 300 字的小故事（需截图）这一部分主要涉及本地推理和部署。我们先看一张图。我们把从架构上把整个服务流程分成下面几个模块。模型推理/服务。主要提供模型本身的推理，一般来说

2024年03月09日
浏览(57)
《书生·浦语大模型全链路开源开放体系》笔记第五课 LMDeploy 的量化和部署

首先我们可以使用 vgpu-smi 查看显卡资源使用情况。可以点击终端（TERMINAL）窗口右侧的「+」号创建新的终端窗口。大家可以新开一个窗口，执行下面的命令实时观察 GPU 资源的使用情况。结果如下图所示，该窗口会实时检测 GPU 卡的使用情况。接下来我们切换到刚刚的终

2024年01月21日
浏览(52)
书生·浦语大模型实战营-学习笔记4

常见的两种微调策略：增量预训练、指令跟随指令跟随微调数据是一问一答的形式对话模板构建每个开源模型使用的对话模板都不相同指令微调原理：由于只有答案部分是我们期望模型来进行回答的内容，所以我们只对答案部分进行损失的计算增量预训练微调数据都是

2024年01月22日
浏览(44)
书生·浦语大模型实战营-第四课笔记

期待已久的微调课增量预训练和指令跟随是两种微调模式，即两种微调策略。 1）增量预训练投喂新的领域知识即可，例如书籍、文章、代码 2）指令跟随采用高质量对话和问答数据进行训练两者是微调的方法，即算法。 xtuner是一种微调框架。

2024年02月21日
浏览(48)
【书生·浦语大模型实战】“PDF阅读小助手”学习笔记

《新版本Lmdeploy量化手册与评测》项目主页：【tcexeexe / pdf阅读小助手】在InternStudio平台中选择 A100 (1/4) 的配置，镜像选择 Cuda11.7-conda ，可以选择已有的开发机 langchain ； Note: /home/tcexeexe/data/model/sentence-transformer ：此路径来自于make_knowledge_repository.py 以上脚本会生成数据库文

2024年01月24日
浏览(44)
【书生·浦语大模型实战营】学习笔记（一）：全链路开源体系介绍

🎉 AI学习星球推荐： GoAI的学习社区知识星球是一个致力于提供《机器学习 | 深度学习 | CV | NLP | 大模型 | 多模态 | AIGC 》各个最新AI方向综述、论文等成体系的学习资料，配有全面而有深度的专栏内容，包括不限于前沿论文解读、资料共享、行业最新动态以、实践教程、求

2024年04月23日
浏览(40)
[书生·浦语大模型实战营]——XTuner 大模型单卡低成本微调

在未经过微调的pretrained LLM中，模型只会尽量去拟合你的输入，也就是说模型并没有意识到你在提问，因此需要微调来修正。 1.1常用的微调模式 LLM的下游应用中, 增量预训练和指令跟随是经常会用到的两种的微调模式。增量预训练微调使用场景:让基座模型学习到一些新知

2024年01月20日
浏览(77)