体验了一把 MiniGPT-4,一言难尽

这篇具有很好参考价值的文章主要介绍了体验了一把 MiniGPT-4,一言难尽。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

最近看到一个好玩的开源项目:MiniGPT-4。

看名字像 GPT-4 的小老弟,其实没啥关系。

简单说,它可以识别图像,基于图像你可以和它对话,它能生成图片描述、网站、诗歌。

先看看官方给出的例子截图。

给图写一段广告词

还能教做饭

根据图配上一段故事

卧槽,AI 长眼睛了!

除此之外,它还能找到图中的笑点、生成诗歌…… 还有更牛的,可以根据一张设计草图,生成站代码

看的我是目瞪口呆…… 上一次这么目瞪口呆,还是看 GPT-4 的演示。

估计看到这里,你和我一样都被惊到了,那接下来的内容,可以让你压压惊了。

这么强的工具,说什么我也得试试啊。

首先我找了一张 911 撞大楼的图片,试试 MiniGPT-4 的识图和描述。

下面是我传给它图片,和我俩的问答。

嗯,它回答的看着还行,像模像样的。

像模像样也就到此为止了,接下来 MiniGPT-4 的表现就有点让我失望。

我找了一个宫保鸡丁的图片,让它教我做饭。

 

MiniGPT-4 看成了炸鸡肉?!

葱段、辣椒:我俩不配被识别?

我提示一下

经过提示,它倒是知道了是宫保鸡丁了。但是做法没改过来…… 还是芥末、香菜……

可能它不擅长中国菜吧,不难为它了,换一道题,据说它能 get 图像的笑点。

我用的这张图

问它笑点在哪

没有解释笑点,只是单纯的描述了图,而且还描述错了,把手机看成了电脑。

我换了问法,又进行了提示,结果还是不太行。

再换个题,来个简单的。

哎,又逃避问题,没回答电影名也就算了,图的描述也有点胡说八道了,“白衬衣黑裤子”,“看起来很休闲”。

心累!每一次提问完等回答,都要等好几分钟,等了半天就等到了这么不正经的回答。

当初看完官方例子之后,我心里还窃喜,MiniGPT-4 可以帮我一个大忙:每次发朋友圈,给图配文字我都费劲想半天,到底文字怎么写才能显得我有才华。

试了一下,结果你们自己看吧。

已经无力吐槽了……

不应该啊,是我的问题?用法不对?

那我用官方例子的图片,试试图片生成代码。我就不信了。

还是老样子,MiniGPT-4 还是无视问题,闷头自己描述……

又问了一次,代码总算写出来了。

但是,这代码看起来也不对啊。

这时候,和官方截图一对比,我有一种的感觉:
红烧牛肉面里没看到牛肉。

以上就是我的体验过程。

因为每次提问之后,等答案都要好久,再加上有点失望,有些想法就没再尝试了。

总的来说,这次体验有点一言难尽:我带着好奇心和不明觉厉玩了半天,结果感觉我被玩了。

但是,静下来想想,MiniGPT-4 这种交互形式还是挺让人眼前一亮的,或许我的用法不对,或许它需要时间来不断迭代进化,或许我们应该给它更多耐心。

就冲着它的团队里有好几个华人名字,怎么着也得支持一下。

希望它以后能速度更快,功能更强大,MiniGPT-4 早日不 Mini。

最后,附上它的几个地址,感兴趣的小伙伴可以去看看。

官网和演示:https://minigpt-4.github.io/

github:https://github.com/Vision-CAIR/MiniGPT-4

论文:https://github.com/Vision-CAIR/MiniGPT-4/blob/main/MiniGPT_4.pdf

 

我建了一个免费 ChatGPT 学习群,在群里就可以免费使用 ChatGPT,入群扫码:

如果上面的群二维码过期了,你可以加我微信,我拉你入群:文章来源地址https://www.toymoban.com/news/detail-482271.html

到了这里,关于体验了一把 MiniGPT-4,一言难尽的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • minigpt4搭建过程记录,简单体验图文识别乐趣

    从3月开始,aigc进入了疯狂的开端,正如4月12日无界 AI直播 在《探索 AIGC 与人类合作的无限可能》中关于梳理的时间线一样,aigc的各种产品如雨后春笋般进入了不可逆的态势,里面有句话很形象,人间一日,AIGC十年。这产变革像是有计划性的沧海桑田,让每个参与者亦或者

    2024年02月05日
    浏览(55)
  • 如此优秀的低代码平台,佬们一起来体验一把!

    前言:低代码平台是一种新兴的应用开发技术,将可视化建模、自动生成代码和开发者编写的代码结合在一起, 使应用程序的开发变得更加快速、简单且高效 。低代码平台的基本思想是通过消除繁琐的手动编码工作,来让开发者更好地专注于业务逻辑和用户体验。 本篇文章

    2024年02月06日
    浏览(40)
  • 【文心一言】文心一言最近这么火,它到底是什么

    前言 文心一言(英文名:ERNIE Bot)是百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。文心一言是知识增强的大语言模型,基于飞桨深度学习平台和文心知识增强大模型,持

    2023年04月25日
    浏览(69)
  • 谷歌的智能AI聊天机器人Bard已免费开放申请,赶紧加入等待列表体验一把

    2023年,真是一个Ai元年,随意ChatGPT的大火,各路网络巨头都按捺不住了,Google更是一度启动了红色警报,这是有史以来,谷歌感受到最大的压力,不过谷歌平时也并不是没有技术沉淀的,其实很最就已经有Ai智能自然语言机器人了,LaMDA甚至都已经有了情感了,所以谷歌与及

    2024年02月06日
    浏览(48)
  • 【Python游戏】在这款程序员游戏新作《现代空战—战机游戏》里,你可以体验一把紧张的空战感觉、刺激鸭~打飞机游戏都能有那么多骚操作……

    不知道大家有没有幻想过遨游在广阔蓝天进行惊险的空战吗? 粉丝白嫖源码福利,请移步至CSDN社区或文末公众hao即可免费。 虽然这样的画面常常只会出现在电影之中,但小编今天给大家编写的一款 Python游戏新作《现 代空战—战机游戏》倒也能让你在游戏中体验一把紧张的空

    2024年02月04日
    浏览(49)
  • 文心一言 内测体验

    文心一言(英文名:ERNIE Bot)是百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。文心一言是知识增强的大语言模型,基于飞桨深度学习平台和文心知识增强大模型,持续从

    2024年02月09日
    浏览(40)
  • 文心一言简单体验

    百度正式发布文心一言,文心一言 这里的插件模式挺有意思: 测试了一下图解说明,随意上传了一张图片: 提供图解让反过来画,抓住了部分重点,但是还是和原图有比较大的差异! 百宝箱 暂未逐个体验,可以对比体验一下!

    2024年02月08日
    浏览(37)
  • 体验文心一言

    继gpt提出后,百度马上发布中国的chat_gpt—》文心一言。目前,文心一言还在测试阶段,需要申请才能参与体验。 小编申请两周后才通过了审核。 为了充分对比gpt和文心一言的差别,小编提出了和gpt一样的问题,方便对比两家的回答。 整体感受是,在代码编写方面,gpt确实

    2024年02月12日
    浏览(31)
  • 体验【文心一言】

    预约文心一言快一个月了,今天被通知可以测试了。 不得不说,图片这块功能确实强大。 但是关于一些文字答案仍有些瑕疵(中国文化博大精深嘛),不过就具体知识方面,做的非常好。

    2024年02月11日
    浏览(37)
  • 文心一言初体验

    在LLM(大型语言模型)方面,国内目前表现比较优秀的,文心一言算一个。 虽然在学术和代码方面和ChatGPT3.5还有点差距,但在中文理解上确实要好上不少。比较好的是,现在有绘画和绘制图表的功能,所见即所得,前提是提供详细的描述和数据,比较赞!希望国内大模型越来越

    2024年02月11日
    浏览(32)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包