第十二篇-Tesla P40+ModelScope+Gradio+QWen+MindChat

1年前作者：木卫二号Coding分类：Toy博客阅读(11)违法举报

这篇具有很好参考价值的文章主要介绍了第十二篇-Tesla P40+ModelScope+Gradio+QWen+MindChat。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

本文主要实现Qwen-7B-Chat与MindChat-Qwen-7B的简单部署与测试

环境

  系统：CentOS-7
  CPU: 14C28T
  显卡：Tesla P40 24G
  驱动: 515
  CUDA: 11.7
  cuDNN: 8.9.2.26

创建环境

conda create --name qwen-chat python=3.10
conda activate qwen-chat

克隆项目

git clone https://github.com/lvxy/qwen-chat-gradio.git
cd qwen-chat-gradio

安装依赖

pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

安装依赖-量化依赖库

pip install bitsandbytes -i https://pypi.tuna.tsinghua.edu.cn/simple

load_in_8bit=True量化加载模型，节省显存

运行

python webui_qwen.py
或者
python webui_mind.py

通过ModelScope下载模型，下载速度还是很好的，下载模型完成，需要一些时间
1.Qwen-7B-Chat 大概15G
2.MindChat-Qwen-7B 大概14G

访问使用

http://127.0.0.1:7860

可以使用体验了

本文参考
https://github.com/X-D-Lab/MindChat/blob/main/webui_demo.py文章来源地址https://www.toymoban.com/news/detail-683277.html

到了这里，关于第十二篇-Tesla P40+ModelScope+Gradio+QWen+MindChat的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

干翻Dubbo系列第十二篇：Dubbo协议介绍
文章目录文章说明一：Dubbo协议 1：Dubbo协议简介 2：Dubbo协议优点 3：Dubbo协议帧的组成 (一)：幻数 (二)：2Way (三)：event (四)：Serilization ID (五)：status (六)：RequestID (七)：数据长度 Rpc过程当中三个核心的要素就是：协议、序列化、通信方式 Dubbo协议
2024年02月12日
浏览(6)
2023年Java核心技术第十二篇（篇篇万字精讲）
目录 22. AtomicInteger 底层实现原理是什么？如何在自己的项目代码中应用CAS操作？ 22.1 典型回答 22.1.1 CAS详细解释： 22.1.1.1 预期值的选取： 22.1.2 CAS的弊端 22.1.2.1 ABA问题： 22.1.2.2 自旋次数限制： 22.1.2.3 只能保证一个共享变量的原子操作： 22.1.3 CAS操作失败的原因以及解决方案
2024年02月10日
浏览(8)
【夜深人静学习数据结构与算法 | 第十二篇】动态规划——背包问题
目录前言： 01背包问题：二维数组思路：一维数组思路：总结：在前面我们学习动态规划理论知识的时候，我就讲过要介绍一下背包问题，那么今天我们就来讲解一下背包问题。在这里我们只介绍 01背包，至于分组背包和混合背包这种的已经属于竞赛级别的
2024年02月12日
浏览(7)
第十二篇 1+X考证 Web前端测试题PHP篇（新）
1、以下关于PHP面向对象的说法错误的是（ A ） A、PHP可以多重继承，一个类可以继承多个父类 B、PHP使用new运算符来获取一个实例对象 C、一个类可以在声明中用extends继承另一个类的方法和属性 D、PHP默认将var解释为public [ 知识点：php不支持多重继承，但是
2024年02月08日
浏览(11)
RK3568驱动指南｜第十二篇 GPIO子系统-第128章 GPIO入门实验
瑞芯微RK3568芯片是一款定位中高端的通用型SOC，采用22nm制程工艺，搭载一颗四核Cortex-A55处理器和Mali G52 2EE 图形处理器。RK3568 支持4K 解码和 1080P 编码，支持SATA/PCIE/USB3.0 外围接口。RK3568内置独立NPU，可用于轻量级人工智能应用。RK3568 支持安卓 11 和 linux 系统，主要面向物联网
2024年01月21日
浏览(10)
第十二篇【传奇开心果系列】Ant Design Mobile of React开发移动应用：内置组件实现酷炫CSS 动画
第一篇【传奇开心果系列】Ant Design Mobile of React 开发移动应用:从helloworld开始第二篇【传奇开心果系列】Ant Design Mobile of React 开发移动应用:天气应用第三篇【传奇开心果系列】Ant Design Mobile of React 开发移动应用:健身追踪第四篇【传奇开心果系列】Ant Design Mobile of React 开发移
2024年01月20日
浏览(10)
Tesla M40 使用分享
这是在咸鱼上花800元购买的的M40 12G显卡进行深度学习的使用说明(时间节点2022.1) 注意这里使用的Tesla显卡是专门的计算卡，所以没有视频输出接口，网上查到的资料说可以有两种使用方法，一是使用核心输出；二是使用另一张quadro亮机卡的双卡输出模式。注意安装M40等大于
2024年02月05日
浏览(9)
不需要本地部署大模型，modelscope-agent加qwen-max免费搭建自己的定制机器人
最近阿里开源了通用大模型qwen-72b,正在为怎么本地化部署发愁，转眼看到提供了qwen-max相关接口的免费试用（据说就是基于qwen-72b大模型)，这就来体验一番。开通阿里云灵积平台，并创建api-key python:3.10+； pydantic 2.0以上,老版本pydantic会报一个tool_schema.model_dump_json的函数错误
2024年01月25日
浏览(8)
第八篇-Tesla P40+ChatGLM2+LoRA
参数：参数根据自己硬件配置自己调整温度：P40自己改个风冷散热，散热效果不好，奔着80度去了显存：占用大概14G Input: 你是谁 ChatGLM-6B: The dtype of attention mask (torch.int64) is not bool 我是AI小木,一个由小吕开发的人工智能助手,我可以回答各种问题,提供信息,甚至进行闲聊。 I
2024年02月14日
浏览(8)
第三篇-Tesla P40+CentOS-7+CUDA 11.7 部署实践
系统：CentOS-7 CPU: 14C28T 显卡：Tesla P40 24G 准备安装驱动: 515 CUDA: 11.7 cuDNN: 8.9.2.26 查看GPU信息步骤一查看是否安装了nouveau，有结果表示正在使用nouveau 步骤二创建一个新的文件，在文件中加入下面两句代码步骤三步骤四重启，步骤五验证是否禁用成功，没有结果表示禁用
2024年02月15日
浏览(14)