阿里云发布通义千问2.0,性能超GPT-3.5,加速追赶GPT-4

这篇具有很好参考价值的文章主要介绍了阿里云发布通义千问2.0,性能超GPT-3.5,加速追赶GPT-4。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

10月31日,阿里云正式发布千亿级参数大模型通义千问2.010个权威测评中,通义千问2.0综合性能超过GPT-3.5,正在加速追赶GPT-4。当天,通义千问APP在各大手机应用市场正式上线,所有人都可通过APP直接体验最新模型能力。

过去6个月,通义千问2.0在性能上取得巨大飞跃,相比4月发布的1.0版本,通义千问2.0复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。目前,通义千问的综合性能已经超过GPT-3.5,加速追赶GPT-4。

阿里云发布通义千问2.0,性能超GPT-3.5,加速追赶GPT-4,人工智能

图:通义千问2.0综合性能超过GPT-3.5,正在加速追赶GPT-4

在MMLU、C-Eval、GSM8K、HumanEval、MATH等10个主流Benchmark测评集上,通义千问2.0的得分整体超越Meta的Llama-2-70B,相比OpenAI的Chat-3.5是九胜一负,相比GPT-4则是四胜六负,与GPT-4的差距进一步缩小。

中英文理解能力是大语言模型的基本功。英语任务方面,通义千问2.0在MMLU基准的得分是82.5,仅次于GPT-4,通过大幅增加参数量,通义千问2.0能更好地理解和处理复杂的语言结构和概念;中文任务方面,通义千问2.0以明显优势在C-Eval基准获得最高得分,这是由于模型在训练中学习了更多中文语料,进一步强化了中文理解和表达能力。

在数学推理、代码理解等领域,通义千问2.0进步明显。在推理基准测试GSM8K中,通义千问排名第二,展示了强大的计算和逻辑推理能力;在HumanEval测试中,通义千问得分紧跟GPT-4和GPT-3.5,该测试主要衡量大模型理解和执行代码片段的能力,这一能力是大模型应用于编程辅助、自动代码修复等场景的基础。

阿里云发布通义千问2.0,性能超GPT-3.5,加速追赶GPT-4,人工智能

图:通义千问2.0发布

通义千问更成熟了,也更好用了。通义千问2.0在指令遵循、工具使用、精细化创作等方面作了技术优化,能够更好地被下游应用场景集成。通义大模型官网上线了多模态和插件功能,支持图片输入、文档解析等细分任务。

与此同时,基于通义大模型训练的8大行业模型组团上线,他们分别是通义灵码-智能编码助手、通义智文-AI阅读助手、通义听悟-工作学习AI助手通义星尘-个性化角色创作平台通义点金-智能投研助手通义晓蜜-智能客服通义仁心-个人专属健康助手通义法睿-AI法律顾问8大行业模型面向当下最受欢迎的多个垂直场景,使用领域数据进行专门训练。用户可以在官网直接体验模型功能,开发者可以通过网页嵌入、API/SDK调用等方式,将模型能力集成到自己的大模型应用和服务中。

阿里云发布通义千问2.0,性能超GPT-3.5,加速追赶GPT-4,人工智能

图:通义大模型家族全面升级,8大行业模型组团上线

截至10月,阿里云已与60多个行业头部伙伴进行深度合作,推动通义千问在办公、文旅、电力、政务、医保、交通、制造、金融、软件开发等领域的落地。

周靖人透露,阿里云计划近期开源通义千问72B版本,此前,阿里云已先后开源7B和14B版本模型,模型累计下载量超过100万。阿里云将持续支持千行百业的开发者基于通义千问开源模型进行模型和应用创新。

阿里云发布通义千问2.0,性能超GPT-3.5,加速追赶GPT-4,人工智能

图:通义千问72B即将开源文章来源地址https://www.toymoban.com/news/detail-737460.html

到了这里,关于阿里云发布通义千问2.0,性能超GPT-3.5,加速追赶GPT-4的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 阿里云开源通义千问720亿参数模型,性能超越大部分商用闭源大模型

    12月1日,阿里云举办通义千问发布会,开源通义千问720亿参数模型Qwen-72B。Qwen-72B在10个权威基准测评创下开源模型最优成绩,成为业界最强开源大模型,性能超越开源标杆Llama 2-70B和大部分商用闭源模型。未来,企业级、科研级的高性能应用,也有了开源大模型这一选项。 通

    2024年02月03日
    浏览(38)
  • 【通义千问】继ChatGPT爆火后,阿里云的大模型“通义千问”它终于来了

    通义千问 顾名思义,通顺流畅的语句可以回答成千上万的问题。这个名字来源于两个方面: “ 通义 ”意味着该模型具有广泛的知识和普适性,可以理解和回答各种领域的问题。作为一个大型预训练语言模型,“通义千问”在训练过程中学习了大量的文本数据,从而具备了跨

    2023年04月13日
    浏览(57)
  • 【文心一言 vs. 通义千文】一言对千问:自百度之后,阿里终于还是出手了——通义千问

    https://tongyi.aliyun.com/ 通义千问 https://tongyi.aliyun.com/ 目录 通义千问 :  达摩院 GPT-30B 模型复现 GPT-3 模型介绍 GPT3中文30B参数量文本生成模型 模型描述 期望模型使用方式以及适用范围 如何使用 模型局限性以及可能的偏差 训练数据介绍 模型训练流程 预处理 训练 推理加速 数

    2024年02月09日
    浏览(44)
  • 阿里「通义千问」内测详细使用体验

    名人说:一花独放不是春,百花齐放花满园。——《增广贤文》 作者:Code_流苏(CSDN) (一个喜欢古诗词和编程的Coder😊) ★观前提示 : 以下内容仅为内测测试内容,不代表未来正式版如何 ,或许你认为它与chatgpt仍有不小的差距,或许你认为它目前做的已经不错了,都可以

    2024年02月06日
    浏览(35)
  • 阿里云“通义千问”开源,可免费商用

    我是卢松松,点点上面的头像,欢迎关注我哦! 阿里云成为国内首个加入大模型开源行列的大型科技企业。就在昨天,阿里云公开表态,把自家的通义千问大模型开源。 阿里云把通用70亿参数模型,包括Qwen-7B和对话模型Qwen-7B-Chat这两款大模型产品给开源了。需要注意的是,

    2024年02月13日
    浏览(32)
  • 阿里入局,通义千问备受期待

    继百度文心一言发布三周之后,4月7日阿里通义大模型终于推出通义千问,阿里正式加入ChatGPT战局。下午市场一片大热,对于深耕NLP多年的阿里,大家有足够的期待。 “你好,我叫通义千问。初次见面,请多指教。”4月7日下午,阿里大模型“通义千问”在阿里云官方微博以

    2023年04月16日
    浏览(35)
  • java对接阿里云通义千问API

    前提条件 1.已经获取申请名额,开通服务并获得API-KEY:开通DashScope并创建API-KEY。 2.maven安装对应的jar包组件 3.java代码调用接口 返回结果

    2024年02月22日
    浏览(40)
  • 【分享】阿里版ChatGPT—通义千问(初体验)

    哈喽,大家好,我是木易巷~ 在上个月4月7号,木易巷开始申请阿里云大模型开始邀请测试「通义千问」,到今天早上,木易巷收到了申请通过的短信。 官网地址:tongyi.aliyun.com 迫不及待去测试了一下,效果还可以,中规中矩。 可以轻松地将结构化数据以Markdown格式输出,并

    2024年02月05日
    浏览(45)
  • 阿里版ChatGPT:通义千问突然上线

    我是卢松松,点点上面的头像,欢迎关注我哦! 4月7日,阿里版的ChatGPT:通义千问突然上线了,由达摩院开发,目前开放预约,但仅面向企业。官网显示通义千问是一个专门响应人类指令的大模型,是效率助手,也是点子生成机。 阿里云和达摩院,一个专攻算力一个擅长A

    2023年04月09日
    浏览(31)
  • 阿里版ChatGPT——通义千问,开箱初体验

    所有行业、所有应用、所有服务都值得基于新型人工智能技术重做一遍,在带来创造性客户体验的同时,生产范式、工作范式、生活范式也将发生变化。——阿里集团董事会主席兼CEO 张勇 2023阿里云峰会上,通义千问大语言模型对外发布,宣称阿里所有App,包括天猫、淘宝、

    2024年02月02日
    浏览(37)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包