讯飞版ChatGPT突然开始内测!我们连夜一手实测

这篇具有很好参考价值的文章主要介绍了讯飞版ChatGPT突然开始内测!我们连夜一手实测。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

明敏 萧箫 发自 凹非寺
量子位 | 公众号 QbitAI

科大讯飞版ChatGPT产品,提前交卷了!

就在昨夜,讯飞骤然向开发者提供了内测通道,取名为讯飞星火认知大模型对外开启内测。

讯飞版ChatGPT突然开始内测!我们连夜一手实测

还有个神奇的英文名字Spark Desk,据说有“火花桌面智能助手”的意思。

讯飞版ChatGPT突然开始内测!我们连夜一手实测

讯飞这波操作,多少有点“反向跳票”的意思,因为早在今年2月初,科大讯飞就被曝加紧开发中国版ChatGPT。随后国内大模型关注度陡增后,科大讯飞率先给出了deadline:5月6日上线产品。

万万没想到,距离正式发布还有10天,他们毫无征兆地开启了内测邀请。

从目前已经获得内测的网友评价来看,有一些人认为效果“超出预期”,但也有人反馈只是“中规中矩”。整体来看,表达效果不错的反馈占多数。

获得内测资格的方式也有点意思,是AI打电话给确认的讯飞版ChatGPT突然开始内测!我们连夜一手实测

讯飞版ChatGPT突然开始内测!我们连夜一手实测

当然,科大讯飞大模型能力究竟如何,最好还是能实测后再说。

所以第一时间拿到内测邀请的我们,也连夜完成了测试。详情如下:

浅测讯飞大模型

登录进去后,首先看到的是讯飞星火认知大模型的自我介绍:

我能学习和理解人类的语言,进行多轮对话、回答问题和高效地帮助人们获取知识和灵感。

讯飞版ChatGPT突然开始内测!我们连夜一手实测

老样子,还是从语文、数学、代码和逻辑几方面,测测讯飞星火认知大模型的综合能力。

那么我们就先从语文能力测起。

考虑到现在弱智吧已经成为ChatGPT时代下的Benchmark了,所以先测试大家想看的环节。

结合下科大讯飞的特点,我们抛给讯飞星火了一个地狱地域笑话。

没想到,它是懂安徽人的讯飞版ChatGPT突然开始内测!我们连夜一手实测

讯飞版ChatGPT突然开始内测!我们连夜一手实测
我们去了图片ID水印,可能导致截图文字不清楚(还望大家理解)

再来一个脑筋急转弯试试。

讯飞星火的回答非常一本正经:首先表示“玉皇大帝是否存在这个事情不是我AI可以下结论的”,这个问题驴唇不对马嘴,玉皇大帝住哪的设定和现代科学没有关系。

但你要非要我说点啥,我只能说或许玉皇大帝可能在地球上空吧。

讯飞版ChatGPT突然开始内测!我们连夜一手实测

不过这段回答里也有个小bug,即在东亚宗教信仰里天界包括天堂和神界(?)

实际上,在一些弱智吧问题里,讯飞星火的表现往往是懂了但没完全懂。

比如它知道焚书坑儒的事,但是又解释不清楚衍生出来的地狱笑话。

讯飞版ChatGPT突然开始内测!我们连夜一手实测

不过在基本语文能力上,讯飞星火的表现还是值得关注的。

比如给出第一句,补充写一首鲁迅风格的诗歌:

讯飞版ChatGPT突然开始内测!我们连夜一手实测

提的要求它都基本满足了,不过紫菜汤为啥曾是渔民的希望?是我理解不了AI的深意了。

换成周杰伦的风格呢?

表现也还不错,马上替换了后三句的内容。怀念童年也是周董歌里经常出现的主题了。

讯飞版ChatGPT突然开始内测!我们连夜一手实测

古文中的对对子,它也能对仗比较工整,表达意思上也没出什么问题。

我们给的上联是:福慧双修须及物。

讯飞版ChatGPT突然开始内测!我们连夜一手实测

再试试成语接龙:

讯飞版ChatGPT突然开始内测!我们连夜一手实测

如果它接错了,提醒下能改正回来,也表现出了一定的多轮对话能力:

讯飞版ChatGPT突然开始内测!我们连夜一手实测

创作的洋葱新闻,也确实有那感觉了~

讯飞版ChatGPT突然开始内测!我们连夜一手实测

续写的恐怖故事也有点水平:

讯飞版ChatGPT突然开始内测!我们连夜一手实测

那么再看看数学能力?

基本的加减法、鸡兔同笼应对起来都很轻松了。

讯飞版ChatGPT突然开始内测!我们连夜一手实测讯飞版ChatGPT突然开始内测!我们连夜一手实测

不过在高数方面还是有点困难,让它求解:f(x)=x(x-1)(x-2)(x-3),f’(0)=?

即便在我们提醒它算错了情况下,修正起来也比较困难(正确答案为-6)。

讯飞版ChatGPT突然开始内测!我们连夜一手实测

OK,接下来就轮到代码能力了。

我们给的要求是:帮我写一个计算器程序。

确实完成了一个四则运算的简单计算器,甚至还有命令行操作界面:

讯飞版ChatGPT突然开始内测!我们连夜一手实测

除了有一个小bug(函数外不能return)外,简单修改后可以运行。

讯飞版ChatGPT突然开始内测!我们连夜一手实测

另外对于Python缩进的空格与tab之争,这只AI是个空格党。

这里贴上代码块,大伙儿可以试试:

#coding=utf-8
#量子位注:AI没生成这句,根据不同运行环境可能需要加一下

# 定义函数,实现加法运算

def add(x, y):

    return x + y

# 定义函数,实现减法运算

def subtract(x, y):

    return x - y

# 定义函数,实现乘法运算

def multiply(x, y):

    return x * y

# 定义函数,实现除法运算

def divide(x, y):

    if y == 0:
        print("除数不能为零!")
        return
    else:
        return x / y

# 主程序

print("欢迎使用计算器!请选择需要进行的操作:")

print("1. 加法")

print("2. 减法")

print("3. 乘法")

print("4. 除法")

choice = input("请输入操作编号(1/2/3/4):")

num1 = float(input("请输入第一个数字:"))

num2 = float(input("请输入第二个数字:"))

if choice == '1':

    print(num1, "+", num2, "=", add(num1, num2))
elif choice == '2':

    print(num1, "-", num2, "=", subtract(num1, num2))
elif choice == '3':

    print(num1, "*", num2, "=", multiply(num1, num2))
elif choice == '4':

    if num2 == 0:
        print("除数不能为零!")
        # return (量子位注:这里有bug,注释掉就可)
    else:
        print(num1, "/", num2, "=", divide(num1, num2))
else:

    print("非法输入!")

生成表格能力也是有的,同时可以按照要求修改表格:

讯飞版ChatGPT突然开始内测!我们连夜一手实测讯飞版ChatGPT突然开始内测!我们连夜一手实测

分析基本逻辑问题也OK:

讯飞版ChatGPT突然开始内测!我们连夜一手实测

而且我们感觉讯飞星火的回答,总是很正经,对于脑洞大开的问题也是淡定的“总分总式”回答。

讯飞版ChatGPT突然开始内测!我们连夜一手实测

当然也被绕到过沟里,回答出了“贾母找人搬机器”的瞎话:

讯飞版ChatGPT突然开始内测!我们连夜一手实测

以上就是我们对讯飞星火的一个浅浅测试。

能力水平已经看到了,而大模型本身让人好奇的,还有它的技术细节~

提前扒扒它的“模型底细”

毕竟讯飞大模型还没正式发布,所以我们试着先从它自己这里“探探口风”。

看看能不能通过问相关问题,提前摸出一些关于它的资料来。

先是名字由来。讯飞星火认知大模型给出了技术向、公司向和文化向三个方面的回答,有议论文内味了:

讯飞版ChatGPT突然开始内测!我们连夜一手实测

再仔细追问一下为什么“星火”和“心宿”有关,好家伙,话题逐渐占星学了起来:

讯飞版ChatGPT突然开始内测!我们连夜一手实测

这里我们调戏一下大模型,问问科大讯飞CEO是否喜欢占星学讯飞版ChatGPT突然开始内测!我们连夜一手实测

讯飞版ChatGPT突然开始内测!我们连夜一手实测

回到正题。那么,讯飞星火认知大模型的训练数据来源、模型参数量、联网状态如何?

首先是关于模型训练数据的来源。看起来资料还比较丰富,目前也还在不断更新中:

讯飞版ChatGPT突然开始内测!我们连夜一手实测

所以,讯飞大模型是否和ChatGPT一样,用了RLHF呢?它自己的回答竟然是没有:

讯飞版ChatGPT突然开始内测!我们连夜一手实测

那么接下来,是关于模型参数量的问题,这里讯飞大模型回答得也比较模糊。

而且,给出的模型参数量竟然只有数亿个?(要知道,GPT-2模型参数量都有15亿)

讯飞版ChatGPT突然开始内测!我们连夜一手实测

最后,是关于模型能否联网的问题。

看起来,它还不会实时联网,关于网易和暴雪的新闻只能追溯到几年前的消息:

讯飞版ChatGPT突然开始内测!我们连夜一手实测

用户也不能通过指令直接让它访问某个网站,查询特定信息,应该是加了某些限制:

讯飞版ChatGPT突然开始内测!我们连夜一手实测

不过有意思的是,它还是声称自己需要联网工作,以访问特定信息数据:

讯飞版ChatGPT突然开始内测!我们连夜一手实测

据讯飞星火认知大模型介绍,目前它的训练数据还在继续更新。

讯飞版ChatGPT突然开始内测!我们连夜一手实测

换而言之,就是还在继续迭代,估计在正式发布前还会更新一版模型。

目前来看,科大讯飞的这个讯飞星火认知大模型,表现已算不错。

而且要知道,讯飞原计划给出的交卷时间是5月6日,现在突然发布内测,相当于不仅没跳票,还“反向跳票”了一波。

这样来看,除了科大讯飞在这NLP和认知智能方面确实有很深的技术积累以外,也说明,讯飞的技术和工程团队实战能力值得关注一波——不仅能打硬仗,而且“说到做到”。

现在距离正式发布还有10天,你期待讯飞的大模型迭代出什么新效果?

《中国AIGC算力产业全景报告》征集倒计时

AIGC算力需求爆发,谁将在此次算力产业变革中脱颖而出?

量子位《中国AIGC算力产业全景报告》《最值得关注的AIGC算力玩家》征集即将截止,欢迎更多优秀的机构、产品、技术案例与我们联络 ~

点这里👇关注我,记得标星哦~文章来源地址https://www.toymoban.com/news/detail-430140.html

到了这里,关于讯飞版ChatGPT突然开始内测!我们连夜一手实测的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • ChatGPT模型大战:讯飞星火认知大模型、百度文心一言能否击败GPT-4(含个人内测体验测试邀请码获取方法,2小时申请成功,亲测有效)

    科技领域的巨头科大讯飞5月6日在安徽省合肥市召开了一场盛大的发布会,正式发布了其最新的讯飞星火认知大模型,引起了广泛的关注和热议。据科大讯飞董事长刘庆峰和研究院院长刘聪介绍,目前该大模型已经在文本生成、知识问答、数学能力等三大能力上超越了ChatGPT,

    2024年02月06日
    浏览(53)
  • 【SparkDesk vs. ChatGPT4】科大讯飞“星火”实测:AI 写作能力(92分+)ChatGPT 大模型在电商业务中的应用、技术方案、价值创新,5000字。

    ChatGPT4的写作内容参考:【ChatGPT】ChatGPT 在电商业务中的应用、技术方案、价值创新_禅与计算机程序设计艺术的博客-CSDN博客  

    2024年02月09日
    浏览(47)
  • 科大讯飞交卷,实测星火大模型

    作者 | 辰纹 来源 | 洞见新研社 星星之火,可以燎原。 5月6日,讯飞星火认知大模型揭开神秘面纱。 发布会上,科大讯飞董事长刘庆峰、研究院院长刘聪现场实测了星火大模型七大核心能力,并发布基于该大模型的教育、办公、汽车和数字员工等多个领域的相关产品。 与此

    2024年02月03日
    浏览(67)
  • 讯飞星火大模型 与New Bing实测对比

    昨天科大讯飞发布了讯飞星火认知大模型,在发布会现场实测大模型的7种核心能力,并发布了它在教育、办公、汽车、数字员工领域的应用成果。科大讯飞董事长刘庆峰表示:认知大模型展示了通用人工智能的曙光,讯飞星火认知大模型已在文本生成、知识问答、数学能力

    2024年02月03日
    浏览(51)
  • 百度chatgpt内测版

    搜索AI伙伴 申请到了百度的chatgpt: 完整的窗口布局:   三个哲学问题: 灵感中心:   请做一副画,一个渔夫,冬天,下着大雪,在船上为了一家的生计在钓鱼,远处的山上也都是白雪,整个西湖上就他一个孤独的身影   输入框中不知道如何换行,测试了enter,shift+enter,

    2024年02月13日
    浏览(35)
  • 谷歌版 ChatGPT Bard 开放内测申请了!

    公众号关注 “GitHubDaily” 设为 “星标”,每天带你逛 GitHub! 上个月初,Google 在巴黎开了一场技术发布会,对外展示一款可用于对抗 ChatGPT 的聊天机器人: Bard 。 只可惜,出师未捷身先死,Bard 在实际产品演示过程中,犯下了天体物理学的一个客观错误。 在演示时,用户问

    2024年02月09日
    浏览(43)
  • 获取了文心一言的内测及与其ChatGPT、GPT-4 对比结果

    百度在3月16日召开了关于文心一言(知识增强大语言模型)的发布会,但是会上并没现场展示demo。如果要测试的文心一言 也要获取邀请码,才能进行测试的。 我这边通过预约得到了邀请码,大概是在3月17日晚就收到了,原本想着18号来测试一下文心一言到底怎么样,但是因

    2024年01月21日
    浏览(45)
  • 文心一言 ChatGPT 实测对比

    很远是因为 :我个人测试得出来的实际效果和ChatGPT差距还很大,下面我会放一些对比。当然也有很多正面例子,回答和ChatGPT相当,甚至中文语境下还好一些。值得肯定。 不远是因为 : 作为第一个敢正面硬刚ChatGPT的百度,打响了第一枪,和国内其它各个大厂阿里腾讯头条等

    2024年02月01日
    浏览(68)
  • 阿里版 ChatGPT 突然上线!

    转自:纯洁的微笑 其实早本月初,就传出过不少阿里要推出类ChatGPT的消息。 前几天率先流出的天猫精灵“鸟鸟分鸟”脱口秀版GPT,就是基于大模型的“压缩版”,已经以其惊艳表现吸引了众目光。 如今“原版大菜”上桌,自然一点即着,引爆舆论关注。 官方非常低调,表示

    2023年04月11日
    浏览(40)
  • 解锁讯飞星火:从零开始,教你如何轻松驾驭这款全能AI工具

    星火助手中心   |  原创作者/编辑:凯哥Java                      |  分类:人工智能学习系列教程 0 1 前言 在之前的文章中,介绍了AI的好处,但是我们知道,因为种种原因,在国内想要访问AI需要通过上网手段才可以访问到,而且还有封号风险。今天凯哥给大家介绍一款

    2024年02月21日
    浏览(70)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包