通义千问开源了 720 亿、70亿、140亿、Qwen-VL 四个大模型：实现“全尺寸、全模态”开源

这篇具有很好参考价值的文章主要介绍了通义千问开源了 720 亿、70亿、140亿、Qwen-VL 四个大模型：实现“全尺寸、全模态”开源。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

本心、输入输出、结果

通义千问开源了 720 亿、70亿、140亿、Qwen-VL 四个大模型：实现“全尺寸、全模态”开源

编辑：简简单单 Online zuozuo
地址：https://blog.csdn.net/qq_15071263

个人简介 : 简简单单Online zuozuo，目前主要从事 Java 相关工作，商业方向为 B、G 端，主要使用Java、Python 进行日常开发，喜欢探索各个方面的内容，对很多的方向、内容感兴趣：目前对 AIGC、云计算、物联网方向感兴趣

未闻万里蓬莱，而窥先圣遗智。故，以此生筑梦，奔而逐之;以泰山之伟，攀而登之;以静雅素心，处世为人。

欢迎有兴趣的朋友相互交流，共同成长。微信: tja6288 商务合作/资料获取/技术交流

如果觉得本文对你有帮助，欢迎点赞、收藏、评论

前言

2023年12月1日，阿里云宣布通义千问720亿参数模型Qwen-72B开源，一同开源的还有18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。加上之前开源的70亿、140亿参数的2款大语言模型，以及视觉理解模型Qwen-VL，通义千问实现了“全尺寸、全模态”开源。

通义千问开源了 720 亿、70亿、140亿、Qwen-VL 四个大模型：实现“全尺寸、全模态”开源,开源,阿里云,通义千问开源,通义千问

阿里云CTO周靖人

阿里云CTO周靖人表示：

开源生态对促进中国大模型的技术进步与应用落地至关重要，通义千问将持续投入开源，希望成为‘AI时代最开放的大模型’，与伙伴们共同促进大模型生态建设

8月以来开源的大模型Qwen-7B（70亿参数）、Qwen-14B（140亿参数）和视觉理解模型Qwen-VL得到中小企业和个人开发者的青睐，累计下载量超过150万，催生出150多款新模型、新应用

通义千问闭源模型也在持续进化，一个月前发布的通义千问2.0版闭源模型，最近已进阶至2.1版，上下文窗口长度扩展到32k，代码理解生成能力、数学推理能力、中英文百科知识、幻觉诱导抵抗能力分别提升30%、10%、近5%和14%，用户可以在通义千问APP免费体验最新版本的闭源模型

通义千问开源了 720 亿、70亿、140亿、Qwen-VL 四个大模型：实现“全尺寸、全模态”开源,开源,阿里云,通义千问开源,通义千问

阿里云

阿里云方面表示：

此前中国大模型市场还没出现足以对标国外Llama 2-70B的优质开源模型，Qwen-72B抬升了开源大模型的尺寸和性能，是业界最强开源模型，填补了国内空白。基于Qwen-72B，大中型企业可开发商业应用，高校、科研院所可开展AI for Science等科研工作

通义千问开源了 720 亿、70亿、140亿、Qwen-VL 四个大模型：实现“全尺寸、全模态”开源,开源,阿里云,通义千问开源,通义千问

72B 的通义千问性能如何

本次开源的Qwen-72B性能更胜一筹，在10个权威基准测评中夺得开源模型最优成绩，在部分测评中超越闭源的GPT-3.5和GPT-4。据悉，Qwen-72B可以处理最多32k的长文本输入，在长文本理解测试集LEval上取得了超越ChatGPT-3.5-16k的效果。研发团队优化了Qwen-72B的指令遵循、工具使用等技能，使之能更好地被下游应用集成

用户可在魔搭社区直接体验Qwen系列模型效果，也可通过阿里云灵积平台调用模型API（应用程序接口），或基于阿里云百炼平台定制大模型应用。阿里云人工智能平台PAI针对通义千问全系列模型进行深度适配，推出了轻量级微调、全参数微调、分布式训练、离线推理验证、在线服务部署等服务

通义千问开源了 720 亿、70亿、140亿、Qwen-VL 四个大模型：实现“全尺寸、全模态”开源,开源,阿里云,通义千问开源,通义千问