解读 | 阿里通义千问模型全尺寸开源 “诚意满满“背后的名与利

这篇具有很好参考价值的文章主要介绍了解读 | 阿里通义千问模型全尺寸开源 “诚意满满“背后的名与利。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

阿里通义千问大模型,极智前沿,通义千问,阿里,阿里云,大模型开源,前沿科技,解读,百模大战



大家好,我是极智视界,欢迎关注我的公众号,获取我的更多前沿科技分享

邀您加入我的知识星球「极智视界」,星球内有超多好玩的项目实战源码和资源下载,链接:https://t.zsxq.com/0aiNxERDq

12 月 1 日阿里开源了 72B 和 18B 大模型以及音频大模型 Qwen-Audio,再加上之前八月份、九月份开源的 7B 和 14B 大模型,号称是 "全尺寸开源"。我也去 Github 上瞅了一眼,通义应该确实是 "兜库底" 了,所有规格的模型都开源了。

阿里通义千问大模型,极智前沿,通义千问,阿里,阿里云,大模型开源,前沿科技,解读,百模大战

对于这个事情,我的第一反应是:难得啊,对于阿里这种技术相对封闭的公司来说。但是仔细想想,目前对于大模型来说,开不开源真的很重要吗?其实是需要打个问号的,除非你 OpenAI 的 GPT-4 开源,不然业界应该很难激起过多的浪花,因为大家都见多不怪了。现在对于大模型真正卡脖子地方是在 "算力" 和 "数据" 上,而不在 "算法" 上。以前是这三驾马车都很重要,然后算法可能会更加重要一些。但是现在大模型时代则不太一样,特别是在美国芯片禁令的情况下,主要矛盾已经明显倾向于对于算力的需求上。现在国内很多大模型从算法实现角度,都可以用 "套壳" LLaMA 来达到 "自研大模型" 商业化的目的,这个时候你通义开不开源其实并不太重要。而说到 "套壳",就又是另外一个有意思的话题了,这里不过多展开。

阿里通义千问大模型,极智前沿,通义千问,阿里,阿里云,大模型开源,前沿科技,解读,百模大战

阿里通义千问大模型,极智前沿,通义千问,阿里,阿里云,大模型开源,前沿科技,解读,百模大战

现在主要矛盾点在于我要有足够的算力、足够高质量的数据来进行微调甚至是从头训练。对于很多大模型厂商来说,区别只是在我选 LLaMA 来微调还是选通义大模型来微调,而相信大多还是会选 LLaMA。这其实可以类比到手机领域,安卓大家都可以用,很多时候有安卓就够了,你鸿蒙开源对于小米、对于 vivo 的操作系统研发意义大吗,我小米会把自己手机操作系统切到基于鸿蒙的吗 (可能确实有参考意义,比如对于小米澎湃 OS 的研发,但是对于大多数厂商来说还是用安卓就够够的了),大家更加在意的是能够拥有性能更加好的芯片、算力更加好的处理器,比如前段时间经常上热搜的全大核天玑 9300,这才是核心竞争力。

阿里通义千问大模型,极智前沿,通义千问,阿里,阿里云,大模型开源,前沿科技,解读,百模大战

虽然 (是反转没错了),在大家有 LLaMA 可选的情况下,通义的开源意义确实不大。但是开源总能赢得好名声,这点毋庸置疑,何况通义开源了自己全规格的模型,其开源的 70B 大模型也是目前开源大模型中最大规模的,可以说 "诚意满满",对于博一个好名声应该是不难的,这是 ""。

然后咱们来说说 "",通义大模型是开源了,大家要用、要微调得要有算力吧,算力哪里来,答案就是阿里云,你品,你细品。来,继续分析,阿里还有个号称国产 HaggingFace 的魔塔 ModelScope,要用开源的通义你就得上魔塔,而魔塔部署在哪里呢,魔塔的算力来源于哪里呢,答案依旧是阿里云,你品,你细品。阿里的这招太 "精明" 了,真的是既想要名也想要利啊

阿里通义千问大模型,极智前沿,通义千问,阿里,阿里云,大模型开源,前沿科技,解读,百模大战

从这个角度来说,其实在 12 月 1 日阿里宣布全量开源通义前问大模型的时候,阿里已经彻底换赛道了,已经是不想跟大家玩大模型了,已经不再是 "百模大战" 中的一员了。未来,"百模大战" 肯定会继续,而阿里更加聪明,烧钱去做大模型,效果嘛打不过 GPT-4,落地商业化嘛又难,竞争对手又像疯了一样的涌进来,换个赛道,躺着挣钱它不香嘛。这大概率也是在学英伟达、特别是在学 AWS。提供付费算力,这才是大模型时代正确的挣钱的方式啊,这些才是大模型时代挣麻了的企业啊。继续给阿里支招,继续开源数据集,让大家在阿里云上训练(烧钱)彻底没有技术上的障碍,而变成一个愿不愿意花钱的问题。

阿里通义千问大模型,极智前沿,通义千问,阿里,阿里云,大模型开源,前沿科技,解读,百模大战

阿里云,是懂计算的。计算无法计算的价值,数钱数到手抽筋

阿里通义千问大模型,极智前沿,通义千问,阿里,阿里云,大模型开源,前沿科技,解读,百模大战


【极智视界】

《解读 | 阿里通义千问模型全尺寸开源 "诚意满满"背后的名与利》文章来源地址https://www.toymoban.com/news/detail-769051.html

到了这里,关于解读 | 阿里通义千问模型全尺寸开源 “诚意满满“背后的名与利的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 一周 AIGC 丨苹果下架多款 AIGC 应用,阿里云开源通义千问 70 亿参数模型

    多个 AIGC 应用在苹果应用商店下架,包含数据采集和使用不够规范等问题。阿里云开源通义千问 70 亿参数模型,包括通用模型 Qwen-7 B 和对话模型 Qwen-7 B-Chat。腾讯混元大模型开始应用内测,内部多个业务线接入测试。百度智能云“千帆大模型平台”升级,接入 LLaMA2 等 33 个模

    2024年02月14日
    浏览(34)
  • 阿里云通义千问开源第二波!大规模视觉语言模型Qwen-VL上线魔搭社区

    通义千问开源第二波!8月25日消息,阿里云推出大规模视觉语言模型Qwen-VL,一步到位、直接开源。Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发,支持图文输入,具备多模态信息理解能力。在主流的多模态任务评测和多模态聊天能力评测中,Qwen-VL取得了远超同等规

    2024年02月11日
    浏览(37)
  • 阿里通义千问开源 320 亿参数模型;文字和音频自动翻译成手语Hand Talk拉近人与人的距离

    ✨ 1: Qwen1.5-32B Qwen1.5-32B是Qwen1.5系列中性能与效率兼顾的最新语言模型,内存占用低,运行速度快。 Qwen1.5-32B是Qwen1.5语言模型系列的最新成员,这个模型是基于先进的技术研发的,旨在提供一种既高效又经济的AI语言理解和生成工具。 Qwen1.5-32B是一款既高效又经济实惠的语言模

    2024年04月12日
    浏览(48)
  • 阿里云“通义千问”开源,可免费商用

    我是卢松松,点点上面的头像,欢迎关注我哦! 阿里云成为国内首个加入大模型开源行列的大型科技企业。就在昨天,阿里云公开表态,把自家的通义千问大模型开源。 阿里云把通用70亿参数模型,包括Qwen-7B和对话模型Qwen-7B-Chat这两款大模型产品给开源了。需要注意的是,

    2024年02月13日
    浏览(37)
  • 【通义千问】继ChatGPT爆火后,阿里云的大模型“通义千问”它终于来了

    通义千问 顾名思义,通顺流畅的语句可以回答成千上万的问题。这个名字来源于两个方面: “ 通义 ”意味着该模型具有广泛的知识和普适性,可以理解和回答各种领域的问题。作为一个大型预训练语言模型,“通义千问”在训练过程中学习了大量的文本数据,从而具备了跨

    2023年04月13日
    浏览(66)
  • 提前预体验阿里大模型“通义千问”的方法来了!

    随着AI大模型的浪潮席卷全球,如今的AI技术已经颠覆了大家对传统AI的认识,微软更是用浏览器与搜索引擎上的实践,证明了当今的AI技术具备打破行业格局的能力。 对于我们应用开发者来说,AI基建的建设与竞争是无法参与的,但在AI的应用领域依然大有可为!目前,国内各

    2024年02月09日
    浏览(46)
  • 阿里发布通义千问!1行代码,免费对话GPT大模型

    大家好,这里是程序员晚枫,今天给大家分享一个好用的东西👉1行代码,使用阿里的GPT聊天大模型:通义千问。 GPT刚推出的时候,百度推出了文心一言、腾讯推出了混元大模型,阿里一直没动静。 自从马云回归,阿里的大模型也开始发力了,推出了自己的大模型:通义千问

    2024年01月22日
    浏览(43)
  • 使用开源通义千问模型(Qwen)搭建自己的大模型服务

    1、使用开源的大模型服务搭建属于自己的模型服务; 2、调优自己的大模型; 采用通义千问模型,https://github.com/QwenLM/Qwen 1、下载模型文件 开源模型库:https://www.modelscope.cn/models 2、下载使用docker 镜像 3、启动脚本 https://github.com/QwenLM/Qwen/blob/main/docker/docker_web_demo.sh 4、运行 访

    2024年02月01日
    浏览(54)
  • 通义千问开源模型在PAI灵骏的最佳实践

    12月1日,通义千问再次宣布重磅开源,目前通义千问已推出1.8B、7B、14B、72B 四款不同尺寸的开源大语言模型。阿里云PAI灵骏智算服务,是面向大规模深度学习场景的智算产品,一站式提供异构算力底座及AI工程平台。本实践将展示如何基于阿里云PAI灵骏智算服务,在通义千问

    2024年02月03日
    浏览(40)
  • 终于通过啦! 我拿到了阿里云【通义千问】大模型AI测试体验资格啦!

    🚀 个人主页 极客小俊 ✍🏻 作者简介:web开发者、设计师、技术分享博主 🐋 希望大家多多支持一下, 我们一起进步!😄 🏅 如果文章对你有帮助的话,欢迎评论 💬点赞👍🏻 收藏 📂加关注 通义千问 是什么? 🚩 通义千问 ,是 阿里云 推出的一个超大规模的 AI语言模型

    2024年02月05日
    浏览(189)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包