【通义千问】大模型Qwen GitHub开源工程学习笔记（3）-- 通过Qwen预训练语言模型自动完成给定的文本

1年前作者：大表哥汽车人分类：Toy博客阅读(7)违法举报

这篇具有很好参考价值的文章主要介绍了【通义千问】大模型Qwen GitHub开源工程学习笔记（3）-- 通过Qwen预训练语言模型自动完成给定的文本。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

摘要：

本笔记分析了使用预训练的模型生成文本的示例代码。它的步骤如下：文章来源地址https://www.toymoban.com/news/detail-728225.html

使用已加载的分词器 tokenizer 对输入文本进行处理，转换为模型可以理解的格式。输入文本是国家和首都的信息，最后一句是未完成的，需要模型来生成。
将处理后的输入转移到模型所在的设备上（例如GPU或CPU）。
使用模型的 generate 方法对输入进行处理，生成预测的输出。
使用分词器的 decode 方法将生成的输出从模型理解的格式转换回文本，并打印出来。

实例分析

from transformers import AutoModelForCausalLM, AutoTokenizer
from transformers.generation import GenerationConfig

# 可选的模型包括: "Qwen/Qwen-7B", "Qwen/Qwen-14B"
tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen-7B", trust_remote_code=True)

# 打开bf16精度，A100、H100、RTX3060、RTX3070等显卡建议启用以节省显存
# model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen-7B", device_map="auto", trust_remote_code=True, bf16=True).eval()
# 打开fp16精度，V100、P100、T4等显卡建议启用以节省显存
# model = AutoModelForCausalLM.from_pretrained("Qwen/Q

到了这里，关于【通义千问】大模型Qwen GitHub开源工程学习笔记（3）-- 通过Qwen预训练语言模型自动完成给定的文本的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

使用开源通义千问模型（Qwen）搭建自己的大模型服务
1、使用开源的大模型服务搭建属于自己的模型服务； 2、调优自己的大模型；采用通义千问模型，https://github.com/QwenLM/Qwen 1、下载模型文件开源模型库：https://www.modelscope.cn/models 2、下载使用docker 镜像 3、启动脚本 https://github.com/QwenLM/Qwen/blob/main/docker/docker_web_demo.sh 4、运行访
2024年02月01日
浏览(12)
通义千问开源了 720 亿、70亿、140亿、Qwen-VL 四个大模型：实现“全尺寸、全模态”开源
本心、输入输出、结果编辑：简简单单 Online zuozuo 地址：https://blog.csdn.net/qq_15071263 个人简介 : 简简单单Online zuozuo，目前主要从事 Java 相关工作，商业方向为 B、G 端，主要使用Java、Python 进行日常开发，喜欢探索各个方面的内容，对很多的方向、内容感兴趣：目前对 AIGC、云
2024年02月04日
浏览(5)
阿里云通义千问开源第二波！大规模视觉语言模型Qwen-VL上线魔搭社区
通义千问开源第二波！8月25日消息，阿里云推出大规模视觉语言模型Qwen-VL，一步到位、直接开源。Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发，支持图文输入，具备多模态信息理解能力。在主流的多模态任务评测和多模态聊天能力评测中，Qwen-VL取得了远超同等规
2024年02月11日
浏览(9)
玩一玩通义千问Qwen开源版，Win11 RTX3060本地安装记录！
大概在两天前，阿里做了一件大事儿。就是开源了一个低配版的通义千问模型--通义千问-7B-Chat。这应该是国内第一个大厂开源的大语言模型吧。虽然是低配版，但是在各类测试里面都非常能打。官方介绍： Qwen-7B是基于Transformer的大语言模型, 在超大规模的预训练数据上进
2024年02月13日
浏览(12)
通义千问Qwen模型运行异常解决记录：FlashAttention only supports Ampere GPUs or newer
通过langchain调用Qwen/Qwen-1_8B-Chat模型时，对话过程中出现报错提示：很疑惑，其他LLM模型都能正常运行，唯独Qwen不行。查了很多资料，众说纷纭，未解决。于是仔细看报错信息，最后一行报错说 File “/root/anaconda3/envs/chatchat/lib/python3.10/site-packages/langchain_community/chat_models/ope
2024年01月21日
浏览(10)
通义千问 - Code Qwen能力算法赛道季军方案
在23年最后一月，我们团队 VScode 参加了天池通义千问AI挑战赛 - Code Qwen能力算法赛道，经过初赛和复赛的评测，我们最后取得季军的成绩，团队成员来自中科院计算所、B站等单位，在这里非常感谢队友的努力付出，下面是一些我们参加比赛的历程和方案分享，欢迎大家讨论和
2024年01月21日
浏览(12)
llama.cpp部署通义千问Qwen-14B
llama.cpp是当前最火热的大模型开源推理框架之一，支持了非常多的LLM的量化推理，生态比较完善，是个人学习和使用的首选。最近阿里开源了通义千问大语言模型，在众多榜单上刷榜了，是当前最炙手可热的开源中文大语言模型。今天在github上看到前几天llama.cpp已经支持Qwe
2024年02月03日
浏览(9)
通义千问开源模型在PAI灵骏的最佳实践
12月1日，通义千问再次宣布重磅开源，目前通义千问已推出1.8B、7B、14B、72B 四款不同尺寸的开源大语言模型。阿里云PAI灵骏智算服务，是面向大规模深度学习场景的智算产品，一站式提供异构算力底座及AI工程平台。本实践将展示如何基于阿里云PAI灵骏智算服务，在通义千问
2024年02月03日
浏览(8)
阿里云通义千问14B模型开源！性能超越Llama2等同等尺寸模型
9月25日，阿里云开源通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat,免费可商用。Qwen-14B在多个权威评测中超越同等规模模型，部分指标甚至接近Llama2-70B。阿里云此前开源了70亿参数模型Qwen-7B等，一个多月下载量破100万，成为开源社区的口碑之作。 Qwen-14B是一款支持多种
2024年02月08日
浏览(12)
解读 | 阿里通义千问模型全尺寸开源 “诚意满满“背后的名与利
大家好，我是极智视界，欢迎关注我的公众号，获取我的更多前沿科技分享邀您加入我的知识星球「极智视界」，星球内有超多好玩的项目实战源码和资源下载，链接：https://t.zsxq.com/0aiNxERDq 12 月 1 日阿里开源了 72B 和 18B 大模型以及音频大模型 Qwen-Audio，再加上之前八月份、
2024年02月03日
浏览(7)