ChatGPT，文心一言，Bard 到底哪家强？最新测评来了！

1年前作者：算法channel分类：Toy博客阅读(9)违法举报

这篇具有很好参考价值的文章主要介绍了ChatGPT，文心一言，Bard 到底哪家强？最新测评来了！。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

你好，我是郭震！

这篇文章测评三个AI大模型能力：

ChatGPT，文心一言，Bard 到底哪家强？最新测评来了！,chatgpt,文心一言,bard

常见生成对话式大模型APP，除最早OpenAI发布的ChatGPT外，还有百度文心一言、谷歌Bard等。

今天从代码生成角度，测评三大模型的能力。

为什么选择这个角度？

而不是其他角度？如写周报，写诗等。

因为这些能力怎么判断对错呢？没有统一、明确的评判标准，测评就不会客观了。

相反，代码生成能力不一样，错一点都不行，并且判断标准统一、明确，主要两点：

第一：代码正确解决问题
第二，稳定运行，无bug

明确测评标准后，找一个稍微有些测评技术含量的问题：Python编写一个贪吃蛇游戏。

此游戏的实现逻辑相对复杂，即便有经验的程序员要想满足上面两点，一次写完通过也是很有难度的。我们看看机器的表现如何。

三大AI模型，全部使用各家最好模型。

1 ChatGPT

首先问问ChatGPT，这是其中部分回答截图：

ChatGPT，文心一言，Bard 到底哪家强？最新测评来了！,chatgpt,文心一言,bard

复制代码到PyCharm (Python最常用的集成开发环境)中，运行结果如下所示：

ChatGPT，文心一言，Bard 到底哪家强？最新测评来了！,chatgpt,文心一言,bard

玩玩游戏，看看有无bug，测试3次，结果表明：

1) 一次回复完整代码
2) 一次运行通过，程序正确实现贪吃蛇游戏（按键盘上下左右箭头，黑色方块会移动，当与淡绿色方块接触时，方块消失（被吃））
3）程序测试三次，无bug

2 文心一言

文心一言是百度大模型。提问它编写贪吃蛇游戏，返回的代码部分截图，共58行（写过贪吃蛇游戏的应该也知道，这些代码肯定不完整）

ChatGPT，文心一言，Bard 到底哪家强？最新测评来了！,chatgpt,文心一言,bard

复制到PyCharm中，运行代码，结果显示这样，很明显有问题，且无交互能力：

ChatGPT，文心一言，Bard 到底哪家强？最新测评来了！,chatgpt,文心一言,bard

再给文心一言一次机会，重新生成一遍答案，这次与上次一样代码未写完就终止，这次生成59行终止，继续追问它，它回复未回答完：

ChatGPT，文心一言，Bard 到底哪家强？最新测评来了！,chatgpt,文心一言,bard

稍微有些出乎意料第二次还没回答完，第三次回答终于完成。复制所有代码到PyCharm，运行结果是这样，之后程序异常退出：

ChatGPT，文心一言，Bard 到底哪家强？最新测评来了！,chatgpt,文心一言,bard

3 Bard生成代码

Bard是谷歌研发的大模型，同样问题提问它：

ChatGPT，文心一言，Bard 到底哪家强？最新测评来了！,chatgpt,文心一言,bard

Bard没有效仿ChatGPT打字机的回复形式，而是思考片刻后，一下全部发我代码（最后部分代码截图），速度很快：

ChatGPT，文心一言，Bard 到底哪家强？最新测评来了！,chatgpt,文心一言,bard

同样复制代码到PyCharm中，第一眼竟然出现没有导入random模块：

ChatGPT，文心一言，Bard 到底哪家强？最新测评来了！,chatgpt,文心一言,bard

我手写导入random模块，然后运行程序，贪吃蛇的界面出现两个不同颜色的小方块，1秒钟后程序闪退：

ChatGPT，文心一言，Bard 到底哪家强？最新测评来了！,chatgpt,文心一言,bard

通过录制运行视频，截取帧，找到那转瞬即逝的一帧：

ChatGPT，文心一言，Bard 到底哪家强？最新测评来了！,chatgpt,文心一言,bard

测试总结

ChatGPT，文心一言，Bard 到底哪家强？最新测评来了！,chatgpt,文心一言,bard

1 ChatGPT，一次生成代码，代码正确无bug
2 文心一言，三次生成代码，代码不正确
3 Bard，一次生成代码，代码不正确

初步结论：ChatGPT目前生成能力是最好的

ChatGPT 2个月用户就破亿，也印证了这点，如果国内再能直接使用上，估计还会更快。

大家知道零基础学习某个技术，刚开始，难以判断生成答案对错。如果答案再有错误，那无疑会增加学习的难度。这就是如今为什么资料那么多，但是却迟迟无法真正掌握一门技术的重要原因之一。

学技术，认准一个最好的，保证在竞争中不输在工具使用上，这是对于我们个体而言，比较重要的一点！

最后说下个人看法，当今AI技术强如Google，大家看到，他们的Bard依然无法生成像ChatGPT那样准确无误的代码。ChatGPT确实独树一帜，其他大模型想超越它，难度不小。

你们觉得呢？欢迎留言

访问网址：http://zglg.work

或点击下面，阅读更多，登录小蜜蜂AI使用ChatGPT
文章来源地址https://www.toymoban.com/news/detail-799287.html

到了这里，关于ChatGPT，文心一言，Bard 到底哪家强？最新测评来了！的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

谷歌推Bard百度推文心一言：挑战ChatGPT 竞争白热化
雷递网雷建平 2月7日在ChatGPT大获成功的推动下，百度宣布将推出类ChatGPT项目，该项目名字确定为文心一言，英文名ERNIE Bot，三月份完成内测，面向公众开放。目前，文心一言在做上线前的冲刺。 2022年9月，百度CEO李彦宏判断人工智能发展在“技术层面和商业应用层面，都
2023年04月22日
浏览(6)
中国版的chatGPT“文心一言“到底怎样？
GPT4的提前发布，把压力着实给到百度了！在ChatGPT引爆聊天机器人领域后的数月，我们终于迎来了国内的第一款生成式对话产品。 3月16日14:00，百度文心一言新闻发布会于百度北京总部正式召开。百度创始人、董事长兼CEO李彦宏也实现了自己此前的诺言，将酷技术真正变成了
2024年02月11日
浏览(9)
中国版ChatGPT来了！快跟我一起申请文心一言吧
随着ChatGPT的快速进化吸引了全球网友的眼球国内厂商也纷纷推出了相似的产品其中百度推出的“文心一言”已经正式开始的相关的测试很多人都在问文心一言入口在哪？文心一言邀请码在哪可以领？文心一言怎么申请内测？自从文心一言发布后，现在账号开始排队申请
2023年04月15日
浏览(7)
文心一言是中文版的ChatGPT？多角度分析猜测文心一言到底是什么？
ChatGPT爆火网络，一时间风靡不断。 AI替代人类工作的传言四起宣布ChatGPT类似产品的公司股价大涨，这到底是什么？国产的类似产品到底到了什么程度？让我们一起来分析（猜猜）看！声明:以下数据均来自官方及部分数据收集，以中国普通网民身份角度阐述，不存在捧踩，
2024年02月02日
浏览(8)
文心一言 v.s. ChatGPT：多角度对比测评“追赶者”能否超越？
ChatGPT自发布以来就引发了关注热潮，如今国内大模型的发展也是如火如荼、百花齐放：比如百度的文心一言、阿里的通义千问、讯飞的星火大模型等等，那么作为后起之秀的国内大模型与ChatGPT相比哪个更好用呢？“追赶者”能否实现超越？为了回答这个问题，本文将基于文
2024年01月22日
浏览(7)
人工智能AI大战：BARD、ChatGPT、Bing和文心一言谁更具有优势？
首先在开始对比之前我首先要吐槽，不管是bard还是百度的AI现在都得等待候补，也就是排队，所以目前只能无限期等待下去，但是第一批用户已经在查通过平台上遨游了好几个月了，从商业的角度来看，几个月或许不长，但是足以失去了超过80%的用户，所以chatgpt目前可以独占
2023年04月24日
浏览(5)
ChatGPT、文心一言、New Bing到底哪个更AI？
目录 ChatGPT 和 GPT4 什么关系？ 1. 写作题目 ChatGPT ChatGPT 国外镜像网站文心一言 New Bing 总结 2. 数学题目题目 ChatGPT ChatGPT 国外镜像网站文心一言 New Bing 总结 3. 翻译题目 ChatGPT 编辑 ChatGPT 国外镜像网站文心一言 New Bing 总结 4. 代码编写题目 ChatGPT ChatGPT 国外镜像网站文
2024年02月02日
浏览(7)
一个关于宏定义的问题，我和ChatGPT、NewBing、Google Bard、文心一言居然全军覆没？
今天在问答模块回答了一道问题，要睡觉的时候，又去看了一眼，发现回答错了。问题描述：下面的z的值是多少。我当时的回答是：z=4+5=9 但是编译运行的结果是：8 又看了一眼，恍然大悟，我曾经在文章中写过：宏的替换是简单的文本替换（请好好理解这句话），它在预
2024年02月10日
浏览(7)
Bard：谷歌推出聊天机器人，与百度文心一言、ChatGPT和New Bing比较如何？
自从谷歌在GPT-4发布一周后推出了聊天机器人Bard以来，人工智能行业再次迎来了一场巨变。Bard目前已经开启内测，作为一款聊天机器人，它受到了业界的广泛关注。在此之前，百度的文心一言、OpenAI的ChatGPT和微软的New Bing也引发了广泛讨论。那么，谷歌的Bard与这些聊天机器
2024年02月13日
浏览(11)
大模型语言模型的全面测评：ChatGPT、讯飞星火认知大模型、文心一言、昆仑天工和通义千问
在当今人工智能技术日益成熟的背景下，大模型语言模型的应用越来越广泛。作为一名AI爱好者，我测试了五个平台的大模型，分别是ChatGPT、讯飞星火认知大模型、文心一言、昆仑天工和通义千问。通过对这五个平台的提问并得到其回答结果，我深刻感受到这些大模型的强大
2024年02月10日
浏览(11)