一个关于宏定义的问题,我和ChatGPT、NewBing、Google Bard、文心一言 居然全军覆没?

这篇具有很好参考价值的文章主要介绍了一个关于宏定义的问题,我和ChatGPT、NewBing、Google Bard、文心一言 居然全军覆没?。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

一、问题重述

今天在问答模块回答了一道问题,要睡觉的时候,又去看了一眼,发现回答错了。

问题描述:下面的z的值是多少。

#define FUN(a,b) a<b?a:b

int x = 5, y = 8, z;
z = 4 + FUN(x, y);

我当时的回答是:z=4+5=9

但是编译运行的结果是:8

一个关于宏定义的问题,我和ChatGPT、NewBing、Google Bard、文心一言 居然全军覆没?

又看了一眼,恍然大悟,我曾经在文章中写过:宏的替换是简单的文本替换(请好好理解这句话),它在预处理阶段进行。当编译器遇到宏名称时,会将其替换为定义中指定的代码片段。宏替换是直接替换,没有类型检查或语法分析。

上面的代码经过预处理后是:

z = 4 + 5 < 8 ? 5:8 ;

现在,z=8应该没问题了。


如果是:

#define FUN(a,b) (a<b?a:b)

结果则是9

如果是:

#define FUN(a,b) (a<b)?a:b

结果则是5

二、AI 解题

突然好奇,这个问题,AI会不会做错呢,结果令我大吃一惊😲😲

2.1 ChatGPT

第一次问:
一个关于宏定义的问题,我和ChatGPT、NewBing、Google Bard、文心一言 居然全军覆没?

我说答案是8,他依旧坚持9,来来回回拉扯好几次:
一个关于宏定义的问题,我和ChatGPT、NewBing、Google Bard、文心一言 居然全军覆没?
n次拉扯后:
一个关于宏定义的问题,我和ChatGPT、NewBing、Google Bard、文心一言 居然全军覆没?

2.2 NewBing

只能说孺子可教:
一个关于宏定义的问题,我和ChatGPT、NewBing、Google Bard、文心一言 居然全军覆没?

2.3 Google Bard

情况跟ChatGPT差不多:

(1)
一个关于宏定义的问题,我和ChatGPT、NewBing、Google Bard、文心一言 居然全军覆没?

(2)

一个关于宏定义的问题,我和ChatGPT、NewBing、Google Bard、文心一言 居然全军覆没?

2.4 文心一言

这位更是重量级😅: 毕竟它自称擅长文本创作这方面。

一个关于宏定义的问题,我和ChatGPT、NewBing、Google Bard、文心一言 居然全军覆没?
其他国内模型就不展开了,差不多。

2.5 小结

(1)注意细节

我明明知道宏定义是文本替换,仍然反了错,实属不该。

(2)AI 并不完全可靠

从这个例子就可以看出,现在,AI 并不完全可靠(当然AI成长的很快)。如果我不知道宏定义的知识,当问了几个AI模型后,可能就会坚信那个错误答案。所以,对信息的甄别能力是很重要的。另外,也要提升自己的能力,才能在未来更好地使用AI工具。

为什么这些AI模型会犯错呢?

它们并不是万能的,本文的这个问题也不是什么复杂的难题,它们却全答错了,而且还要纠正半天。这应该与模型的训练数据有关,或许很少有人像上面那样写代码,或许很多人都犯这个错。对于保密程度很高的内容、前沿技术、特殊情况…AI或许不比人高明。

(3)AI模型版本

上面的问答中,NewBing的效果相对较好,轻轻一点就能修正错误。

  • ChatGPT iOS手机APP中使用的免费版本是:GPT-.5,Plus是4.0。
    一个关于宏定义的问题,我和ChatGPT、NewBing、Google Bard、文心一言 居然全军覆没?

  • ChatGPT网页版 :5.10号已经放弃使用GPT-3.5的Lagacy版本,现在使用的是default版本,应该是做了优化,Plus用户可以选择GPT4。
    一个关于宏定义的问题,我和ChatGPT、NewBing、Google Bard、文心一言 居然全军覆没?

  • NewBing手机版和网页版都是:GPT-4.0
    一个关于宏定义的问题,我和ChatGPT、NewBing、Google Bard、文心一言 居然全军覆没?

从上面的叙述可以发现,GPT-4貌似比GPT-3.5好上许多。

GPT-4 的提升:

可以在GPT-4的paper中看到与3.5的对比。
一个关于宏定义的问题,我和ChatGPT、NewBing、Google Bard、文心一言 居然全军覆没?

paper摘要:

这是一种大规模的多模态模型,可以接受图像和文本输入并产生文本输出。虽然在许多现实场景中的能力不如人类,但 GPT-4 在各种专业和学术基准测试中表现出人类水平的表现,包括通过模拟律师考试,得分在应试者的前 10% 左右。 GPT-4 是一种基于 Transformer 的预训练模型,用于预测文档中的下一个标记。培训后的对齐过程会提高真实性和遵守所需行为的措施的性能。该项目的核心组成部分是开发可在广泛范围内表现可预测的基础设施和优化方法。这使我们能够基于不超过 GPT-4 计算量的 1/1,000 的训练模型准确预测 GPT-4 性能的某些方面。

总结一下GPT3.5和GPT4.0的区别:

  1. GPT3和GPT4的最大不同之处在于规模,GPT3拥有175B参数,而GPT4拥有3.3T参数,可以有效地解决复杂语言任务。

  2. 另一个重要的不同之处在于GPT4使用了树型推理(Tree-Based Reasoning)来完成建模,这使得GPT4更加稳定、精确、高效。GPT4的模型可以有效地解决自然语言交互(NLU)和自然语言理解(NLU)等复杂NLP任务。

  3. 更创造性的写作能力,包括编歌曲、写剧本、学习用户写作风格

  4. 可以接受图片输入(暂不可用)、并生成字幕等

  5. 可以处理超过25000字长文本

  6. 智能程度大幅提升。以美国BAR律师执照统考为例:GPT3.5可以达到10%水平分,GPT4可以达到90%水平分。生物奥林匹克竞赛从GPT3.5的31%水平分,直接飙升到99%水平分,国际奥赛金奖水准。

真是一场历史性变革~



~ 文章来源地址https://www.toymoban.com/news/detail-494939.html

到了这里,关于一个关于宏定义的问题,我和ChatGPT、NewBing、Google Bard、文心一言 居然全军覆没?的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Google发布ChatGPT竞品Bard

    北京时间2月7日凌晨,谷歌CEO桑达尔·皮查伊(Sundar Pichai)在万众瞩目之下突然发布了谷歌的下一代对话AI系统Bard(https://blog.google/technology/ai/bard-google-ai-search-updates/)。 从博客中可以看出,此次发布比较草率,只是个试验品,只开放给受信任的测试人员。听说Google大模型组人

    2024年02月11日
    浏览(28)
  • Google Bard 对战 ChatGPT4

    话题之一:如何降低血压 我家老爷子血压有点高,所以我挑了这么个话题。 如果用中文来问 Bard, 有点欺负它,那么索性用英文 1. Bard 在速度上占有绝对优势 2. GPT4 在最后一条监测就医建议上,完胜。 很多老人得过且过,不敢就医。这条建议特别有用 话题之二:过去某天天

    2024年02月09日
    浏览(44)
  • ChatGPT与Google Bard那个更好?

    AIGC 行业最大的两个竞争对手:ChatGPT vs Google Bard! 本文介绍这两个人工智能引擎之间的技术差异。 截至目前Google Bard和ChatGPT之间最大的区别是:Bard知道ChatGPT,但ChatGPT却对Bard懵然不知。虽然我们可以玩转ChatGPT,而Bard对我们大多数人来说仍然遥不可及。 ChatGPT和Google Bard都是人

    2024年02月12日
    浏览(25)
  • ChatGPT 与 Google Bard:技术差异比较

    Artificial Intelligence (AI) chatbots are becoming increasingly popular, and two of the most well-known examples are ChatGPT and Google Bard. While both use machine learning algorithms to generate responses to user prompts, there are significant technical differences between them. 人工智能 (AI) 聊天机器人正变得越来越流行,其中两个最著名

    2024年02月06日
    浏览(35)
  • 【ChatGPT】Google‘AI chatbot-Bard.

    参考视频:https://edu.csdn.net/learn/38346/614937  1.打卡网址:https://bard.google.com/      接着就可以使用谷歌的Bard了。

    2024年02月16日
    浏览(30)
  • Claude 2、ChatGPT、Google Bard优劣势比较

      ​Claude 2: 优势:Claude 2能够一次性处理多达10万个tokens(约7.5万个单词)。 tokens数量反映了模型可以处理的文本长度和上下文数量。tokens越多,模型理解语义的能力就越强)。它在法律、数学和编码等多个领域表现出色,在标准化测试中获得更高分。它可以自我改进和适

    2024年02月13日
    浏览(32)
  • google大模型Bard下场【谷歌版本的ChatGPT】

    本文需要会可学上网,不会直接拉到底部 google大模型开始下场了https://bard.google.com/,点击链接用谷歌账户登录就能使用 步骤 第一步:如果你有谷歌账号,你所做的就只是登录【一个谷歌账号,可以帮你在大部分地方免登录,尤其是国外的应用(比如小蓝鸟等等)】 如果没有

    2024年02月13日
    浏览(34)
  • ChatGPT | Bing | Google Bard | 讯飞星火 | 到底哪家强?实测

    最近AIGC战场依然热闹,微软的new bing、Google的Bard、国内的讯飞星火认知大模型,都接连上阵,我们对比ChatGPT一起来看看,我把实际使用测试结果发出,供大家参考。有些测试结果可能会出乎大家的预料哦… 今天我们暂时主要比拼4个能力: 字符计算能力 文学创意能力 实时新

    2024年02月09日
    浏览(50)
  • 【Google Bard】公测已开始,与文心一言、chatGPT相比如何?

    自从2022年11月30日,openAI开放聊天机器人chatGPT之后,其热度一直居高不下。 openAI公司成立于2015年,成立后不久,微软就对其工作给予了大力支持,包括资金援助、以及提供高性能服务器。 在这些合作基础上,openAI已经向微软授权了GPT-3技术(2022年9月)以及chatGPT技术(2023年

    2024年02月09日
    浏览(57)
  • Beezy 实测:Bard Google vs ChatGPT,你该怎么选?

    随着人工智能技术的不断发展,越来越多的创新型公司开始加入这场“智能化”竞赛。在众多的AI企业中,Bard Google和ChatGPT无疑是两大巨头。两家公司都拥有自己独特的技术,同时也面临着自己的挑战。 在本文中,我们将通过交互功能、文本生成、逻辑推理、创意写作等多个

    2024年02月09日
    浏览(34)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包