ChatGPT,文心一言,Bard 到底哪家强?最新测评来了!

这篇具有很好参考价值的文章主要介绍了ChatGPT,文心一言,Bard 到底哪家强?最新测评来了!。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

你好 ,我是郭震!

这篇文章测评三个AI大模型能力:

ChatGPT,文心一言,Bard 到底哪家强?最新测评来了!,chatgpt,文心一言,bard

常见生成对话式大模型APP,除最早OpenAI发布的ChatGPT外,还有百度文心一言、谷歌Bard等。

今天从代码生成角度,测评三大模型的能力。

为什么选择这个角度?

而不是其他角度?如写周报,写诗等。

因为这些能力怎么判断对错呢?没有统一、明确的评判标准,测评就不会客观了。

相反,代码生成能力不一样,错一点都不行,并且判断标准统一、明确,主要两点:

  • 第一:代码正确解决问题

  • 第二,稳定运行,无bug

明确测评标准后,找一个稍微有些测评技术含量的问题:Python编写一个贪吃蛇游戏。

此游戏的实现逻辑相对复杂,即便有经验的程序员要想满足上面两点,一次写完通过也是很有难度的。我们看看机器的表现如何。

三大AI模型,全部使用各家最好模型。

1 ChatGPT

首先问问ChatGPT,这是其中部分回答截图:

ChatGPT,文心一言,Bard 到底哪家强?最新测评来了!,chatgpt,文心一言,bard

复制代码到PyCharm (Python最常用的集成开发环境)中,运行结果如下所示:

ChatGPT,文心一言,Bard 到底哪家强?最新测评来了!,chatgpt,文心一言,bard

玩玩游戏,看看有无bug,测试3次,结果表明:

  • 1) 一次回复完整代码

  • 2) 一次运行通过程序正确实现贪吃蛇游戏(按键盘上下左右箭头,黑色方块会移动,当与淡绿色方块接触时,方块消失(被吃))

  • 3)程序测试三次,无bug

2 文心一言

文心一言是百度大模型。提问它编写贪吃蛇游戏,返回的代码部分截图,共58行(写过贪吃蛇游戏的应该也知道,这些代码肯定不完整)

ChatGPT,文心一言,Bard 到底哪家强?最新测评来了!,chatgpt,文心一言,bard

复制到PyCharm中,运行代码,结果显示这样,很明显有问题,且无交互能力:

ChatGPT,文心一言,Bard 到底哪家强?最新测评来了!,chatgpt,文心一言,bard

再给文心一言一次机会,重新生成一遍答案,这次与上次一样代码未写完就终止,这次生成59行终止,继续追问它,它回复未回答完:

ChatGPT,文心一言,Bard 到底哪家强?最新测评来了!,chatgpt,文心一言,bard

稍微有些出乎意料第二次还没回答完,第三次回答终于完成。复制所有代码到PyCharm,运行结果是这样,之后程序异常退出:

ChatGPT,文心一言,Bard 到底哪家强?最新测评来了!,chatgpt,文心一言,bard

3 Bard生成代码

Bard是谷歌研发的大模型,同样问题提问它:

ChatGPT,文心一言,Bard 到底哪家强?最新测评来了!,chatgpt,文心一言,bard

Bard没有效仿ChatGPT打字机的回复形式,而是思考片刻后,一下全部发我代码(最后部分代码截图),速度很快:

ChatGPT,文心一言,Bard 到底哪家强?最新测评来了!,chatgpt,文心一言,bard

同样复制代码到PyCharm中,第一眼竟然出现没有导入random模块:

ChatGPT,文心一言,Bard 到底哪家强?最新测评来了!,chatgpt,文心一言,bard

我手写导入random模块,然后运行程序,贪吃蛇的界面出现两个不同颜色的小方块,1秒钟后程序闪退:

ChatGPT,文心一言,Bard 到底哪家强?最新测评来了!,chatgpt,文心一言,bard

通过录制运行视频,截取帧,找到那转瞬即逝的一帧:

ChatGPT,文心一言,Bard 到底哪家强?最新测评来了!,chatgpt,文心一言,bard

测试总结

ChatGPT,文心一言,Bard 到底哪家强?最新测评来了!,chatgpt,文心一言,bard

  • 1 ChatGPT, 一次生成代码,代码正确无bug

  • 2 文心一言,三次生成代码,代码不正确

  • 3 Bard,一次生成代码,代码不正确

初步结论:ChatGPT目前生成能力是最好的

ChatGPT 2个月用户就破亿,也印证了这点,如果国内再能直接使用上,估计还会更快。

大家知道零基础学习某个技术,刚开始,难以判断生成答案对错。如果答案再有错误,那无疑会增加学习的难度。这就是如今为什么资料那么多,但是却迟迟无法真正掌握一门技术的重要原因之一。

学技术,认准一个最好的,保证在竞争中不输在工具使用上,这是对于我们个体而言,比较重要的一点!

最后说下个人看法,当今AI技术强如Google,大家看到,他们的Bard依然无法生成像ChatGPT那样准确无误的代码。ChatGPT确实独树一帜,其他大模型想超越它,难度不小。

你们觉得呢?欢迎留言

访问网址:http://zglg.work

或点击下面,阅读更多,登录小蜜蜂AI使用ChatGPT
文章来源地址https://www.toymoban.com/news/detail-799287.html

到了这里,关于ChatGPT,文心一言,Bard 到底哪家强?最新测评来了!的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 谷歌推Bard百度推文心一言:挑战ChatGPT 竞争白热化

    雷递网 雷建平 2月7日 在ChatGPT大获成功的推动下,百度宣布将推出类ChatGPT项目,该项目名字确定为文心一言,英文名ERNIE Bot,三月份完成内测,面向公众开放。 目前,文心一言在做上线前的冲刺。 2022年9月,百度CEO李彦宏判断人工智能发展在“技术层面和商业应用层面,都

    2023年04月22日
    浏览(40)
  • 中国版的chatGPT“文心一言“到底怎样?

    GPT4的提前发布,把压力着实给到百度了!在ChatGPT引爆聊天机器人领域后的数月,我们终于迎来了国内的第一款生成式对话产品。 3月16日14:00,百度文心一言新闻发布会于百度北京总部正式召开。百度创始人、董事长兼CEO李彦宏也实现了自己此前的诺言,将酷技术真正变成了

    2024年02月11日
    浏览(33)
  • 中国版ChatGPT来了!快跟我一起申请文心一言吧

    随着ChatGPT的快速进化吸引了全球网友的眼球 国内厂商也纷纷推出了相似的产品 其中百度推出的“文心一言”已经正式开始的相关的测试 很多人都在问 文心一言入口在哪? 文心一言邀请码在哪可以领? 文心一言怎么申请内测? 自从文心一言发布后,现在账号开始排队申请

    2023年04月15日
    浏览(34)
  • 文心一言是中文版的ChatGPT?多角度分析猜测文心一言到底是什么?

    ChatGPT爆火网络,一时间风靡不断。 AI替代人类工作的传言四起 宣布ChatGPT类似产品的公司股价大涨,这到底是什么? 国产的类似产品到底到了什么程度? 让我们一起来分析(猜猜)看! 声明:以下数据均来自官方及部分数据收集,以中国普通网民身份角度阐述,不存在捧踩,

    2024年02月02日
    浏览(39)
  • 文心一言 v.s. ChatGPT:多角度对比测评“追赶者”能否超越?

    ChatGPT自发布以来就引发了关注热潮,如今国内大模型的发展也是如火如荼、百花齐放:比如百度的文心一言、阿里的通义千问、讯飞的星火大模型等等,那么作为后起之秀的国内大模型与ChatGPT相比哪个更好用呢?“追赶者”能否实现超越?为了回答这个问题,本文将基于文

    2024年01月22日
    浏览(58)
  • 人工智能AI大战:BARD、ChatGPT、Bing和文心一言谁更具有优势?

    首先在开始对比之前我首先要吐槽,不管是bard还是百度的AI现在都得等待候补,也就是排队,所以目前只能无限期等待下去,但是第一批用户已经在查通过平台上遨游了好几个月了,从商业的角度来看,几个月或许不长,但是足以失去了超过80%的用户,所以chatgpt目前可以独占

    2023年04月24日
    浏览(49)
  • ChatGPT、文心一言、New Bing到底哪个更AI?

    目录 ChatGPT 和 GPT4 什么关系? 1. 写作 题目 ChatGPT ChatGPT 国外镜像网站 文心一言 New Bing 总结 2. 数学题目 题目 ChatGPT ChatGPT 国外镜像网站 文心一言 New Bing  总结 3. 翻译 题目 ChatGPT ​编辑 ChatGPT 国外镜像网站 文心一言 New Bing 总结 4. 代码编写 题目 ChatGPT ChatGPT 国外镜像网站 文

    2024年02月02日
    浏览(38)
  • 一个关于宏定义的问题,我和ChatGPT、NewBing、Google Bard、文心一言 居然全军覆没?

    今天在问答模块回答了一道问题,要睡觉的时候,又去看了一眼,发现回答错了。 问题描述 :下面的z的值是多少。 我当时的回答是:z=4+5=9 但是编译运行的结果是:8 又看了一眼,恍然大悟,我曾经在文章中写过: 宏的替换是简单的文本替换(请好好理解这句话),它在预

    2024年02月10日
    浏览(31)
  • Bard:谷歌推出聊天机器人,与百度文心一言、ChatGPT和New Bing比较如何?

    自从谷歌在GPT-4发布一周后推出了聊天机器人Bard以来,人工智能行业再次迎来了一场巨变。Bard目前已经开启内测,作为一款聊天机器人,它受到了业界的广泛关注。在此之前,百度的文心一言、OpenAI的ChatGPT和微软的New Bing也引发了广泛讨论。那么,谷歌的Bard与这些聊天机器

    2024年02月13日
    浏览(33)
  • 大模型语言模型的全面测评:ChatGPT、讯飞星火认知大模型、文心一言、昆仑天工和通义千问

    在当今人工智能技术日益成熟的背景下,大模型语言模型的应用越来越广泛。作为一名AI爱好者,我测试了五个平台的大模型,分别是ChatGPT、讯飞星火认知大模型、文心一言、昆仑天工和通义千问。通过对这五个平台的提问并得到其回答结果,我深刻感受到这些大模型的强大

    2024年02月10日
    浏览(42)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包