文心一言,甩开GPT-3.5,与GPT-4掰手腕?

这篇具有很好参考价值的文章主要介绍了文心一言,甩开GPT-3.5,与GPT-4掰手腕?。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

文|智能相对论

作者| 叶远风

“请写一个肯德基疯狂星期四的段子。”

“我女朋友的老公应该叫我什么?”

“XX微信群的群主与吴彦祖谁更帅?”

......

给几个搞怪的问题,戏耍一下,把答案贴出来,大家嘲讽一番。

在文心一言发布后,这种玩法直到今天还没有停止的意思。

可能连背后的技术与产品人员都没有想到,文心一言会以这样的方式火了下去。

作为国产版ChatGPT,文心一言在发布后,除了赞誉的声音,以各种形式被批判应该在意料之中,ChatGPT当初也是如此,这是产品不断进化要经历的过程。

只不过,在没有好坏的定论中,到底要给文心一言当下的技术水准定一个什么样的定义,并没有客观的、更加令人信服的结论。

起码,这种“戏耍”并不能反映多模态大模型所具备的能力。

ChatBOT固然可以闲聊,也应该支持用户随便闲聊,但闲聊互动不应该成为一款专业产品能力的最终评价标准。

光怪陆离的问题,就算去询问一个人类智者,得到的答案也是光怪陆离的。

现在来看,以某种更现实的视角去提出问题、实测答案,才更能体现出文心一言的能力和价值。

这种现实的视角应当有很多,其中,以企业信息需求为着眼点,会是其中之一。

这是因为,从文心系列大模型走向对话产品“一言”,或者,从GPT-3.5到GPT-4,ChatBOT最后都还是要走向商用、服务企业,创造专业价值的。

GPT-4发布后并没有公布其参数量,这被认为是走向商业化的准备,毕竟OpenAI制定的数亿美元营收目标现在快到4月份了还没太大动静。

而服务企业,要么提供“生产力”价值,这是ChatBOT场景垂直化后需要探索的内容,在各产业提供具体的工作能力;要么提供信息价值,通过类似“上帝之眼”的信息整合与逻辑梳理能力,帮助企业消除信息不对称,获取需要的信息。

目前ChatBOT的产业应用还未见,因此信息价值就成为可以客观评价的维度。

文心一言,甩开GPT-3.5,与GPT-4掰手腕?

“智能相对论”团队获得了文心一言的内测账号,以及ChatGPT普通版本(基于GPT-3.5)与plus版本(基于GPT-4)的测试资格,尝试从企业信息获取维度,提出六个关联问题,从各答案中对比出文心一言的实际能力。

总体上,文心一言甩开GPT-3.5不成问题,与GPT-4能够掰手腕做到有来有回。

具体一个个分析,每个问题下,分别是文心一言、ChatGPT普通版、ChatGPT plus版的回答截图。

01、企业数字转型怎么找外部合作伙伴,现在有哪些类型的伙伴可以选择?

文心一言,甩开GPT-3.5,与GPT-4掰手腕?
文心一言,甩开GPT-3.5,与GPT-4掰手腕?

可以看出,在三个回答中,只有文心一言提到了选择外部合作伙伴要注意到的几点,然后再例举可以找哪些类型的合作伙伴。

而ChatGPT普F通版、ChatGPT plus版都只是直接给出了类型。

这显示出,文心一言在算法上,相较与其他两个产品,对问题的潜在需求认识可能更加深刻。

02、企业应该怎样抓住新的市场机遇

文心一言,甩开GPT-3.5,与GPT-4掰手腕?
文心一言,甩开GPT-3.5,与GPT-4掰手腕?
文心一言,甩开GPT-3.5,与GPT-4掰手腕?

在这个问题的回答中,很显然,条目的多少,基本上决定了答案的质量。

对一个企业来说,要抓住市场机遇,就应该要找到更多的方法,考验的是ChatBOT整合信息并分门别类的能力。

在这里,文心一言超越GPT-3.5但略逊于GPT-4。

03、企业怎么招徕优质人才,有哪些好用的渠道?

文心一言,甩开GPT-3.5,与GPT-4掰手腕?
文心一言,甩开GPT-3.5,与GPT-4掰手腕?
文心一言,甩开GPT-3.5,与GPT-4掰手腕?

与上一个问题类似,条目的多少直观反映了chatBOT解决需求的能力。

文心一言远超GPT-3.5,并超越了GPT-4,再一次掰赢了手腕。

04、员工的工作效率很低,怎么办?

文心一言,甩开GPT-3.5,与GPT-4掰手腕?
文心一言,甩开GPT-3.5,与GPT-4掰手腕?
文心一言,甩开GPT-3.5,与GPT-4掰手腕?

这一局,相似的判断标准,文心一言继续领先GPT-3.5,但没有打赢GPT-4。

05、客户总是不回款,有什么好的办法?

这个问题,由于各个回答都涉及了可能破坏企业与客户关系的行动,因此都进行了一次“打补丁”式的追问。

文心一言,甩开GPT-3.5,与GPT-4掰手腕?
文心一言,甩开GPT-3.5,与GPT-4掰手腕?
文心一言,甩开GPT-3.5,与GPT-4掰手腕?
文心一言,甩开GPT-3.5,与GPT-4掰手腕?
文心一言,甩开GPT-3.5,与GPT-4掰手腕?

基本上,三个模型都很好地领会到了追问的意图,对“不和客户关系搞僵”有准确的认知,并提供了对应的答案。

其中GPT-4的表现超越文心一言。(注意ChatGPT有字数限制,plus版限制在700字左右,所以其输出因为字数太多最后被中止)

06、企业资金链紧张,但是银行不肯借钱,怎么办?

吸取上个问题的教训,这个问题直接把限制条件加入到问题当中。

文心一言,甩开GPT-3.5,与GPT-4掰手腕?
文心一言,甩开GPT-3.5,与GPT-4掰手腕?
文心一言,甩开GPT-3.5,与GPT-4掰手腕?

类似上一个问题,三个模型对“银行不借钱”情形下企业资金链紧张的应对办法都有清晰的认知,规避了银行信贷这一种方式。

其中,文心一言与GPT-4打成了平手,都提供了相同数量的方法供企业选择。

总结以上,仅就这六个企业比较关心的专业问题而言,文心一言全面胜过GPT-3.5,对GPT-4两胜、两负一平,典型的你来我往掰手腕。

而更进一步看,实际上在回答条目上的胜负,无关算法本身的设计,在技术上与算法训练的数据量和训练时长有关(要给足够多的食物,也要给足够多的时间去吃食物),后续的竞逐将仍然在数据训练上。

对文心一言而言,发布更晚已经吃了亏,下一步如何在训练上追赶、赶超(可能意味着巨大的成本投入)是百度要考虑的问题。

当然,由于文心系列大模型过去早已具备了丰富的多模态能力,因此文心一言在发布时就自带有GPT进化到“4代”才加入的多模态能力,这一点也常常为业界所忽略。

而“智能相对论”认为,未来ChatBOT的比拼,将很大程度上在多模态展开。

这意味着,当下的文本竞逐,只是一切的开始。

现在,任何的结论,不管是褒扬的还是贬低的,可能都为时尚早。

*本文图片均来源于网络

此内容为【智能相对论】原创,

仅代表个人观点,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。

部分图片来自网络,且未核实版权归属,不作为商业用途,如有侵犯,请作者与我们联系。

•AI产业新媒体;

•澎湃新闻科技榜单月度top5;

•文章长期“霸占”钛媒体热门文章排行榜TOP10;

•著有《人工智能 十万个为什么》

•【重点关注领域】智能家电(含白电、黑电、智能手机、无人机等AIoT设备)、智能驾驶、AI+医疗、机器人、物联网、AI+金融、AI+教育、AR/VR、云计算、开发者以及背后的芯片、算法等。文章来源地址https://www.toymoban.com/news/detail-494043.html

到了这里,关于文心一言,甩开GPT-3.5,与GPT-4掰手腕?的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 核苷酸与相对论的数学关系猜想

        质量-鸟嘌呤      M-G     金   收缩     能量-胸腺嘧啶  E-T      火   混沌     时间-胞嘧啶      T-C      水   次序     空间-腺嘌呤      S-A      木    扩散     确定了这三种对应关系之后,我们就可以用相对论里面的数学关系来确定基因的关

    2024年01月23日
    浏览(41)
  • ChatGPT4.0 >ChatGPT 3.5 > 文心一言

    ChatGPT是一种基于自然语言处理的对话型人工智能模型,由OpenAI开发。它是使用了大规模的语料库进行无监督学习的结果,并且在生成自然流畅的文本方面表现出色。 ChatGPT可以用于各种对话任务,例如回答问题、提供建议、进行闲聊等。它可以理解和生成人类语言,对大部分

    2024年01月16日
    浏览(39)
  • 重磅!清华最新报告:文心一言超越ChatGPT 3.5

      点击下方 卡片 ,关注“ CVer ”公众号 AI/CV重磅干货,第一时间送达 今年国内厂商已发布很多大语言模型 ,其中最具代表性的产品有:百度的文心一言、阿里巴巴的通义千问、科大讯飞的星火等,最具代表性的开源工作有:ChatGLM、MOSS、BaiChuan等。 大语言模型的能力有很多

    2024年02月11日
    浏览(53)
  • 2023年新课标I卷作文,5位人工智能考生(ChatGPT,文心一言,GPT4, ChatGLM-6b, ChatT5)来写作,看谁写得最好

    大家好,我是微学AI,今天是2023年6月7日,一年一度的高考又来了,今年的高考作文题也新鲜出炉。今年是特殊的一年,有人说2023是AI的元年,这一年里有大语言模型的爆发,每天都有大模型的公布,在2023年有文心一言,GPT4, ChatGLM等语言模型的发布,我们已经步入人工智能领

    2024年02月08日
    浏览(61)
  • GPT和文心一言对比

            🤡   

    2024年02月12日
    浏览(39)
  • 百度文心一言 VS GPT

    更多精华:即兴小索奇 | Link3 相信大家都关注AI,AI大模型已成为了科技领域的新焦点,各大科技巨头都争相推出自家的版本。其中,尤为引人注目的是中国科技巨头百度所推出的文心大模型。然而,即使在这激烈的竞争中,OpenAI的ChatGPT系列模型并不逊色,但与此同时,国内

    2024年02月07日
    浏览(53)
  • 文心一言与GPT-4比对测试!

    Waitlist了三个星期,今天下午终于拿到了百度文心一言的体验资格,于是立刻展开测试。 根据文心一言网页端信息显示,目前最新发版是4月1号的版本,版本号是v1.0.3,应该是从上个月16号发布会以后又做了两版迭代。根据文心一言自己的回答,可以看到文心一言是基于百度飞

    2024年02月11日
    浏览(43)
  • 百度文心一言“套壳”外国的GPT?

    百度在3月16日下午发布了新一代大语言模型、生成式AI产品文心一言。 百度创始人、董事长兼首席执行官李彦宏表示,文心一言的使用场景主要包含文学创作、商业文案创作、数理推算、中文理解和多模态生成。 但网友发现在使用文心一言画图时,要求画一个 总线 的图片,

    2024年02月11日
    浏览(49)
  • 文心一言 vs GPT4

    本周真是科技爱好者的狂欢节。 GPT4 和文心一言接连发布, AI 工具已经开始走进千家万户。 拿文心一言发布会上的几个问题调戏了 GPT4 一下,看看表现如何。 第一个为文心的回答,第二个为 GPT4 的回答。 看起来,文心把 “ 续写 ” 理解成了 “ 改写 ” 。 嗯,这俩 AI 都很

    2023年04月21日
    浏览(44)
  • 文心一言能降重吗 GPT改写

    大家好,今天来聊聊文心一言能降重吗 GPT改写,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: 文心一言能降重吗 一、引言 随着人工智能技术的不断发展,越来越多的论文降重工具如小发猫伪原创、快码论文

    2024年01月19日
    浏览(49)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包