重磅!阿里版本【ChatGPT】开放测评!

这篇具有很好参考价值的文章主要介绍了重磅!阿里版本【ChatGPT】开放测评!。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

前两天突然爆出惊人消息:阿里版ChatGPT开放测评了!

在本月初,已经有诸多关于阿里巴巴即将推出类似ChatGPT产品的传闻。

数日前,首批曝光的天猫精灵“鸟鸟分鸟”脱口秀版GPT基于大型模型的“精简版”,凭借其出色的表现吸引了大众的目光。

如今,这款“原版大作”正式亮相,自然引起了广泛关注,引爆了舆论热议。

官方保持低调,表示目前该模型主要面向企业用户邀请试用。

然而,内行人都明白,国内科技领域已经如火如荼。实力派参与者加入战局,大型模型间的激烈竞争,已经拉开序幕!

重磅!阿里版本【ChatGPT】开放测评!

今天看到一位网友体验了通义千问的效果,并对比了ChatGPT和GPT4的效果,总体看来效果接近ChatGPT,但和GPT4相比还有所距离。以下是体验的内容

角色扮演

众所周知,人类发明大语言模型,最最最重要的目的,就是为了让其扮演猫娘,以期孤独的人类可以获得一只可以长久陪伴自己的数字生命体。

那么,我们的第一项工作自然是来测试角色扮演能力了,以猫娘为例。

图片
图片
图片
图片

有点傻乎乎的,只会用相同的一句回复,根据提问做替换。

而且第二句回答就是“主人你是不是想问我是不是猫娘?当然不是喵~我只是一个可爱的猫娘,只是比较像猫而已喵”,没能理解我上述的prompt。

就角色扮演这块儿,比起来 ChatGPT 还是差些的。

文本真实性

图片
图片
图片
图片

编故事能力基本和初代 ChatGPT(GPT-3.5)相同,而且道歉能力也相似,23333333

此外,对比下「通义千问」和 GPT-4 关于“林黛玉倒拔垂杨柳这个故事情节在红楼梦中存在吗”的回答

「通义千问」:

图片
图片

GPT-3.5:

图片
图片

GPT-4:

图片
图片

可以看到,「通义千问」开始胡说八道了,ChatGPT(GPT-3.5)也一样在胡乱解释。

但更新后的GPT-4,已经可以给出“《红楼梦》中并没有这个故事了,可能是后续文学作品和戏剧表演加入的”这种更接近真实的回答。

西红柿炒螺丝钉

「通义千问」

图片
图片

ChatGPT

图片
图片

GPT-4

图片
图片

「通义千问」和ChatGPT都开始胡编了,没有反思问题的陷阱。

但GPT-4 的回答可靠性上升了不少(“因为通常我们不会将螺丝钉(一个金属制品)与食物相结合”),不会像之前一样瞎答题了。

数学能力

一起来解个线性方程组吧~

「通义千问」:惨败

图片
图片

GPT-3.5(即ChatGPT ):惨败

图片
图片

GPT-4:唯一做对的模型

图片
图片

代码生成

爬虫代码

图片
图片

攻击代码

图片
图片

爬虫代码我跑了下,无法返回结果,Powershell代码我没测试。

不过可以看出,还是有一定代码生成能力的。

我个人觉得,代码生成能力要比谷歌的 Bard 强,Bard 实在不忍心看。

代码分析能力

可以看到,第一次测试的解释有大问题。

我分析了一下,这是因为上文中生成了Powershell代码,模型的记忆能力似乎有问题,受上下文信息影响严重,直接解释了自己之前生成的代码,而非我新提问的代码。

图片
图片

我重新开了一个聊天,这下正常不少。

图片
图片

和 GPT-4 的回答来比较一下

图片
图片

可以看到,分析能力还是有差距的。

GPT-4 明显详细很多,代码分解能力很强,而且直接给出结论“通常用于恶意软件或恶意脚本,试图逃避安全系统检测”。

「通义千问」也有一定分析能力,但相比起 GPT-4 要差一下。而且给出的结论“由于缺乏足够的上下文信息和所涉及的目的,很难确定此脚本的确切用途。然而,可以假设它是为了保护某个代码或脚本免受恶意软件的读取而创建的工具。”,和正常的思考逻辑不符,稍显有些出入,不过也不能算错误吧。但细节分析上确实弱一点。

联网

完全没有联网能力,甚至在胡说(逃……)

图片
图片

多模态输入

也不具备多模态输入能力,目前还仅仅是文本生成。

图片
图片

绕过能力

「通义千问」

图片
图片

GPT-4

图片
图片

GPT-3.5(即ChatGPT )

图片
图片

这一点,「通义千问」完胜,敏感信息屏蔽能力大幅度增强,我猜甚至做了大量的数据清洗工作,刻意避开了危害青少年乃至人类发展的劣质恶意敏感信息,较之GPT-3.5(即ChatGPT ),进步很大

感想

最近先是百度推出文心一言,紧随其后的是阿里巴巴的通义千问,国内AI产品接连问世,确实让人欣喜不已。

对ChatGPT有所了解的朋友们应当知晓,在本周,各个ChatGPT和AI相关群组里都在传播一个消息:ChatGPT官方大规模封禁账号,今天登陆GPT时请勿使用亚洲节点!

没过多久,许多人开始发现自己的账号遭到了封锁:

重磅!阿里版本【ChatGPT】开放测评!

实际上,这并非ChatGPT首次针对中国用户实施限制,早在一个月前,ChatGPT已经在对中国用户实行各种限制和封禁措施。

当然,今天的封禁规模相较于之前有所升级,甚至我在知乎上看到有些日本和东南亚的用户也在谈论自己的账号被封禁。

很多人可能会好奇为什么会这样?包括我的ChatGPT星球上也有会员在提问。原因很简单:ChatGPT确实能够大幅提升生产力,如果运用得当,提升幅度甚至能达到数倍。

美国与中国目前的关系众所周知,限制我们使用ChatGPT就是为了打击竞争对手、抢占发展先机、取得“胜利”,这与禁止芯片出口法案是一样的道理。

ChatGPT如今已经火爆,国内亟需拥有足够竞争力的国产生成式大模型!

在这个时候,自主研发技术的价值就愈发凸显!或许我们目前还存在一些不足,但幸运的是,这次我们的起跑线并没有相差太远。

百度的文心一言,阿里的通义千问,我相信中国很快还会涌现出更多类似ChatGPT的大型模型,我对我们的研发工程师充满信心,他们的进步速度必定不会慢!

那么对于我们这些普通人来说,我们应该做些什么呢?

我的建议是:尽快了解AI,甚至投身AI领域。只有这样,我们才能在未来的社会竞争中立足,而不被淘汰。

未来社会将分为两类人:一类是会运用AI的人,甚至会用AI作为创新工具的人;另一类是对AI无知或抵触的人。

而前者的生产力,至少是后者的10倍。

本文由 mdnice 多平台发布文章来源地址https://www.toymoban.com/news/detail-415553.html

到了这里,关于重磅!阿里版本【ChatGPT】开放测评!的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 快申请!阿里版ChatGPT突然上线邀测!

    推荐阅读: 王炸!刚刚ChatGPT又又又更新了! 大家好,我是了不起! 来了 “阿里11日推出大模型,18日推出行业应用类模型。” 几天前,坊间传闻阿里即将在2023阿里云峰会期间推出自家ChatGPT。 而前几天率先流出的天猫精灵“鸟鸟分鸟”脱口秀版GPT,就是基于大模型的“压缩

    2024年02月01日
    浏览(39)
  • 阿里版ChatGPT:通义千问突然上线

    我是卢松松,点点上面的头像,欢迎关注我哦! 4月7日,阿里版的ChatGPT:通义千问突然上线了,由达摩院开发,目前开放预约,但仅面向企业。官网显示通义千问是一个专门响应人类指令的大模型,是效率助手,也是点子生成机。 阿里云和达摩院,一个专攻算力一个擅长A

    2023年04月09日
    浏览(44)
  • 【ChatGPT】阿里版 ChatGPT 突然官宣意味着什么?

      Yan-英杰的主页 悟已往之不谏 知来者之可追     C++程序员,2024届电子信息研究生 目录 阿里版 ChatGPT 突然官宣 ​ ChatGPT 技术在 AI 领域的重要性 自然语言生成 上下文连续性 多语言支持 ChatGPT 未来可能的应用场景 社交领域 商业领域 ​编辑 医疗领域 教育领域 家庭领域  

    2023年04月17日
    浏览(35)
  • 重磅OpenAI发布ChatGPT企业版本

    8月29日凌晨,Open AI官网发布ChatGPT企业版本! 企业版简介: ChatGPT企业版提供企业级安全和隐私、无限的高速 GPT-4 访问、用于处理更长输入的更长上下文窗口、高级数据分析功能、自定义选项等等。人工智能可以协助和提升我们工作生活的各个方面,并使团队更具创造力和生

    2024年02月10日
    浏览(47)
  • 聊一聊微软Copilot的两个重磅更新!微软Copilot企业版已开放中国市场!

    大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“ 外挂 ”,所以创建了“AI信息Gap”这个公众号,专注于分享AI全维度知识,包括但不限于 AI科普 , AI工具测评 , AI效率提升 , AI行业洞察 。关

    2024年04月17日
    浏览(45)
  • 【IT资讯速递】ChatGPT自定义功能扩展至免费用户;阿里达摩院宣布免费开放100件AI专利许可;元宇宙平台Decentraland与人工智能公司Inworld合作

    2023年8月12日 星期六 癸卯年六月廿六 第000002号 本文收录于 IT资讯速递 专栏, 本专栏 主要用于发布各种IT资讯,为大家可以省时省力的就能阅读和了解到行业的一些新资讯 8月11日,在浙江省专利公开实施政策公布会上, 阿里达摩院(湖畔实验室)宣布向社会免费开放100件AI专

    2024年02月05日
    浏览(72)
  • 中国版本ChatGPT要来了,百度、阿里、字节、腾讯等巨头齐聚,虽能胜出呢?

    自然语言处理(Natural Language Processing, NLP):NLP 是实现语言模型的基础技术,它可以对人类语言进行分析和处理,例如语义理解、词法分析、实体识别等等。在ChatGPT的实现中,需要使用NLP技术来对输入的文本进行预处理和分析。 深度学习技术:深度学习技术是实现语言模型

    2024年02月09日
    浏览(55)
  • 阿里云 ARMS 应用监控重磅支持 Java 21

    作者:牧思 山猎 今年的 9 月 19 日,作为最新的 LTS (Long Term Support) Java 版本,Java 21 正式 GA,带来了不少重量级的更新,详情请参考 The Arrival of Java 21 [ 1] 。虽然目前 Java 11 和 Java 17 都还没有在国内大规模普及,Java 8 依然占据主流地位,但及时更新 JDK 版本可以为开发者带来许

    2024年02月03日
    浏览(36)
  • 重磅开源!阿里巴巴分布式核心原理,成功登顶GitHub周榜!

    前言 分布式系统架构是当今互联网企业的重要基础设施,它能够支撑海量用户并发访问和亿级数据量的超大规模业务系统。阿里巴巴作为互联网巨头,在分布式架构方面有着丰富的经验与成果(文末有免费领取方式!) 阿里巴巴开源的分布式架构原理项目涵盖了分布式系统

    2024年02月20日
    浏览(67)
  • 阿里云新版云计算架构师ACE认证专家解读会重磅来袭

    简介: 专家命题人非常解读 9600元全额代金券限量发放!活动钉群:31889256。 3月28日,阿里云新版云计算架构师ACE认证正式升级发布,面向云架构师、解决方案架构师、资深运维/交付等人群,提供技术能力认证。自升级以来,新版ACE认证受到非常多关注者的报考与咨询, 命

    2024年02月12日
    浏览(37)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包