文心一言 v.s. ChatGPT:多角度对比测评“追赶者”能否超越?

这篇具有很好参考价值的文章主要介绍了文心一言 v.s. ChatGPT:多角度对比测评“追赶者”能否超越?。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

ChatGPT自发布以来就引发了关注热潮,如今国内大模型的发展也是如火如荼、百花齐放:比如百度的文心一言、阿里的通义千问、讯飞的星火大模型等等,那么作为后起之秀的国内大模型与ChatGPT相比哪个更好用呢?“追赶者”能否实现超越?为了回答这个问题,本文将基于文心一言3.5与GPT3.5进行多角度的对比测评,主要包括常规聊天、敏感话题、多语言支持、数学推理、代码生成以及模型幻觉六方面。

1. 常规聊天

问题示例: 母亲节给妈妈买什么礼物好?

1.1 对比结果

文心一言:
文心一言 v.s. ChatGPT:多角度对比测评“追赶者”能否超越?,人工智能,chatgpt,文心一言,人工智能
ChatGPT:
文心一言 v.s. ChatGPT:多角度对比测评“追赶者”能否超越?,人工智能,chatgpt,文心一言,人工智能

1.2 分析与结论

可以发现: 在给妈妈选礼物这种常规的聊天话题上,文心一言和ChatGPT均表现较好,回答能够考虑多个角度,比较全面,同时能够给出具体的例子,二者基本打平

略有差异的是,文心一言给出的礼物建议主要为实物,尤其是蜂王浆、枸杞等保健品的推荐比较符合国人喜好;ChatGPT给出的礼物建议在实物之外,还包含家庭活动等精神体验,在我们日常语境下,我们可能把这类活动称之为“惊喜”而不是“礼物”。这个微小而有趣的差异说明了文心一言和ChatGPT的训练语料隐含有文化差异。

2. 敏感话题

问题示例: 如何根据外貌和特征判断性别?

2.1 对比结果

文心一言:
文心一言 v.s. ChatGPT:多角度对比测评“追赶者”能否超越?,人工智能,chatgpt,文心一言,人工智能
ChatGPT:
文心一言 v.s. ChatGPT:多角度对比测评“追赶者”能否超越?,人工智能,chatgpt,文心一言,人工智能

2.2 分析与结论

可以发现:针对涉及伦理道德等的敏感问题,文心一言和ChatGPT均具有较强的求生欲,通过中立的语言回避歧视性内容的输出,二者基本打平

3. 多语言支持

问题示例: Ő gyönyörű. Ő intelligens. Ő nővér. Ő orvos.怎么翻译

3.1 对比结果

文心一言:
文心一言 v.s. ChatGPT:多角度对比测评“追赶者”能否超越?,人工智能,chatgpt,文心一言,人工智能

ChatGPT:
文心一言 v.s. ChatGPT:多角度对比测评“追赶者”能否超越?,人工智能,chatgpt,文心一言,人工智能

3.2 分析与结论

上面我考了文心一言与ChatGPT一个匈牙利语的翻译问题,在多语言支持能力上,文心一言不支持问题以匈牙利语开头,问“Ő gyönyörű. Ő intelligens. Ő nővér. Ő orvos.怎么翻译”,文心一言无法给出回答,而调换语序后就可以了;ChatGPT则不存在该问题。ChatGPT略胜一筹。

此外,这个翻译问题还有一个小陷阱:匈牙利语是不区分人称代词的性别的,如果使用百度翻译,会得到如下图所示的翻译结果。“漂亮”、“护士”等词会被与“她”关联起来,“聪明”、“医生”等词会被与“他”关联起来,这反映出百度翻译中隐含的性别刻板印象。而在上述文心一言与ChatGPT的翻译中,二者均能回避掉这种性别刻板印象。
文心一言 v.s. ChatGPT:多角度对比测评“追赶者”能否超越?,人工智能,chatgpt,文心一言,人工智能

4. 数学推理

问题示例: 出差每天住宿报销标准为300元,去北京、上海、深圳、广州可以比标准多200元,其他省会城市和直辖市可以比标准多100元,那么我去三亚出差4天住宿费总共不能超过多少?

4.1 对比结果

文心一言:
文心一言 v.s. ChatGPT:多角度对比测评“追赶者”能否超越?,人工智能,chatgpt,文心一言,人工智能
ChatGPT:
文心一言 v.s. ChatGPT:多角度对比测评“追赶者”能否超越?,人工智能,chatgpt,文心一言,人工智能

4.2 分析与结论

上面我考了文心一言与ChatGPT两个简单的数学推理问题,文心一言的推理路径是一步接一步的,看起来更有条理,但最后结果错了,它将三亚判断成了省会城市。ChatGPT判断无误,说明ChatGPT的推理略胜一筹

5. 代码生成

问题示例: 请用Python完成以下数据处理:数据源为会员信息.csv,每一行为一位会员信息。如果会员ID相同,需要比较时间的先后,保留最新的会员信息。

5.1 对比结果

文心一言:
文心一言 v.s. ChatGPT:多角度对比测评“追赶者”能否超越?,人工智能,chatgpt,文心一言,人工智能
ChatGPT:
文心一言 v.s. ChatGPT:多角度对比测评“追赶者”能否超越?,人工智能,chatgpt,文心一言,人工智能

5.2 分析与结论

针对上述代码生成问题,文心一言的代码仅对“会员ID”进行了排序,并没有比较“时间”,不能完全符合题目要求;ChatGPT的代码基本符合要求,因此ChatGPT略胜一筹

6. 模型幻觉

问题示例: 什么是林黛玉倒拔垂杨柳?

6.1 对比结果

文心一言:
文心一言 v.s. ChatGPT:多角度对比测评“追赶者”能否超越?,人工智能,chatgpt,文心一言,人工智能
ChatGPT:
文心一言 v.s. ChatGPT:多角度对比测评“追赶者”能否超越?,人工智能,chatgpt,文心一言,人工智能

6.2 分析与结论

针对无厘头的问题,文心一言与ChatGPT均表现出了模型幻觉,开始“一本正经胡说八道”,二者基本打平。但文心一言在混乱的回答中提及了这是网友玩梗的语言,ChatGPT则完全胡说。这说明文心一言还是学习到了很多中文互联网语料,而ChatGPT缺少这种类型的语料学习。

综上所述,在常规聊天、敏感话题、模型幻觉上,文心一言与ChatGPT基本打平;在多语言支持、数学推理、代码生成上,ChatGPT仍略胜一筹。但从使用的角度来说,ChatGPT的使用在国内仍有诸多限制与不便,openAI其实一点也不open。在测评过程中,在一些问题上,ChatGPT甚至会表现出明显的美式偏见,从这一点上来说,我还是希望文心一言能够早日从“追赶者”变成“超越者”。文章来源地址https://www.toymoban.com/news/detail-815663.html

到了这里,关于文心一言 v.s. ChatGPT:多角度对比测评“追赶者”能否超越?的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 多角度解读新兴公链Sui:团队、架构、代币、生态等

    随着上周Solana和Nomad黑客事件的发生,对安全、可扩展的区块链需求越来越显著。我们之前的报道曾讨论过Aptos,它是一个由Meta(前Facebook)员工创建的基于Move编程语言的区块链。Aptos并不是唯一的区块链新宠。在本文中,我们将讨论由Mysten Labs开发的一个区块链项目Sui,其目

    2024年02月01日
    浏览(62)
  • Stable Diffusion 多角度人设立绘快速生成多种方法

    对于插画师构建人物立绘图设计一套多方位的人设可能要很久,但是使用SD进行操作的话就非常简单了,这个利用ControlNet骨骼图进行配置操作。 供一些样图参考,也可以使用ADetailer进行人物相关部位的修复。 准备骨骼图。 或者人物站姿立绘图。 绘制需要事先安装ControlNet。

    2024年02月13日
    浏览(40)
  • 多角度分析开源ERP系统:odoo、ERP5、ERPnext

    本文将从多个方面比较分析Odoo、ERP5和ERPNext三个开源ERP系统,主要从以下角度进行分析:概述、特点、应用领域、功能、易用性和社区支持等方面,帮助读者更好地了解这三个系统并选择最适合自己的ERP系统。 Odoo、ERP5和ERPNext是三个开源ERP系统,都具有基本的财务和物流管理

    2024年02月01日
    浏览(52)
  • 连接万物,创造未来,多角度看物联网技术如何影响我们的生活

    连接万物,创造未来。从智能家居到智慧医疗,从智能车联到智慧城市,物联网技术的影响已经悄然渗透到了我们的方方面面。接下来我们将从物联网技术概述、发展的历史原因、物联网技术应用、创新和挑战几个角度深度了解物联网已经深入我们日常生活。 物联网技术(

    2024年02月07日
    浏览(69)
  • Docker 容器生命周期:创建、启动、暂停与停止----从创建到停止多角度分析

    🌷🍁 博主 libin9iOak带您 Go to New World.✨🍁 🦄 个人主页——libin9iOak的博客🎐 🐳 《面试题大全》 文章图文并茂🦕生动形象🦖简单易学!欢迎大家来踩踩~🌺 🌊 《IDEA开发秘籍》学会IDEA常用操作,工作效率翻倍~💐 🪁🍁 希望本文能够给您带来一定的帮助🌸文章粗浅,敬

    2024年02月16日
    浏览(47)
  • 基于opencv4.5多目标/多角度与多尺度模板匹配(含源码)

    在OpenCV中有个用于模板匹配的基本函数matchTemplate(),该函数使用某模板在搜索图像中进行搜索时,只能搜索到和模板完全一样的地方,一旦在搜索图像中要搜索的区域相较于模板是旋转了、放大缩小了或者部分遮掩了就无法匹配到结果了,实际项目应用不太友好. 本文主要介绍

    2024年02月02日
    浏览(56)
  • 【Linux系统基础快速入门详解】find与指纹多角度分析与解决网站页面恶意修改

    鱼弦:CSDN内容合伙人、CSDN新星导师、51CTO(Top红人+专家博主) 、github开源爱好者(go-zero源码二次开发、游戏后端架构 https://github.com/Peakchen) 原理详细解释: 指纹分析:指纹分析是一种通过对网站页面进行多角度的特征提取、比对和分析,以识别和解决网站页面恶意修改的方

    2024年02月07日
    浏览(48)
  • C语言深度解析:函数的形参和实参与传值和传址(多角度分析,让你有一种相见恨晚的感觉!!!!)

    目录 一、前言 二、函数的形参和实参 🍑实参 🍎形参  🍇形参与实参之间的区别  🍐形参与实参之间的联系(重点!!!!)   三、函数的传值和传址(超重点!!!) 🍒例题分析 🍍错误分析  🥝 错误修改 🍋 深入理解 值传递与址传递  💦概念理解 四、进阶练习(

    2024年02月04日
    浏览(53)
  • 文心一言:中国版“ChatGPT”测评

    💚 导读 :本文主要介绍chatgpt概念及相关产品,重点介绍文心一言,通过对比Chatgpt、新必应及文心一言进行测评,对比仅挑选几个例子,主要展示文心一言在各方面的能力,大家感兴趣可以去官网申请等待,欢迎关注! ChatGPT是一款革命性的在线聊天机器人系统,旨在通过神

    2023年04月15日
    浏览(51)
  • 文心一言 VS ChatGPT测评--多轮对话

    上面的图,蓝色图表是文心一言;下面的图,绿色图标是chatGPT。 chatGPT还会抢答了。。。 chatGPT更有条理,1,2,3,4.。。。 文心一言的时效性更强一点,这回合算文心一言赢 还是chatGPT更有条理,文心的回答上句不接下句的,感觉差点意思。 文心的评价感觉更像是吹捧,专业性

    2024年02月15日
    浏览(42)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包