大模型应用时代,百度开了个头

这篇具有很好参考价值的文章主要介绍了大模型应用时代,百度开了个头。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

“只有最好的大模型,才能长出最好的人工智能原生应用”。

随着 8 月底第一批大模型应用通过备案上线,中国人工智能大模型市场进入全新阶段,通过备案的科技公司和机构研发的大模型产品,可以向所有用户提供服务,而之前只能开展人数受限的测试。

许多大模型从业者认为,中国将会出现大量的大模型应用。但怎样用大模型的能力解决大量用户的共同需求做出爆款应用,仍然存在许多未知数。在过去大半年的探索中,一些行动较快的大模型公司和创业者正试着给出参考。

AI 原生应用是大模型存在的意义

9 月 5 日,历时 3 个多月的百度 “文心杯” 创业大赛结束,15 个团队被选为优胜者,他们除了得到百度的数千万元投资,还会在技术、产品、发展战略、资本合作等方面获得百度的长期支持。

百度 CEO 李彦宏在颁奖致辞时说,一个好的人工智能原生应用至少具备三个条件:支持自然语言交互,支持理解、生成、推理、记忆信息等,且交互不应超过两级菜单,人工智能原生应用要能解决过去解决不了或解决不好的问题,而不是对移动互联网应用或者电脑软件的的简单重复。

“模型本身不直接产生价值,基于基础大模型开发出来的应用才是模型存在的意义。” 李彦宏说移动互联网时代操作系统只有 Android 和 iOS,特别成功的应用却很多,大模型时代也会出现类似的情况——基础大模型是操作系统,基于大模型实现的新功能,是人工智能时代的 “原生应用”。

在人工智能的新格局中,大模型能力是基础,它直接决定了大模型应用的上限,但只靠大模型无法构成繁荣的生态,建立在大模型上的应用也是其中关键。

此前中国的大模型都以模型开发为主,应用层往往被忽视。但如果所有人都只关注模型开发,而没有人去开发应用,就会像没有轮子的车。在海外,大模型应用层早已开始发展。在国内,百度算是开了个头。

“我们希望创业者在文心大模型之上,可以做出 AI 时代的爆款应用。” 李彦宏说。百度起于大模型测试阶段的创业大赛现在告一段落,但没有迹象表明百度培育大模型创业生态的动作会停下来。

15 个胜选应用覆盖多个细分方向

基于文档的问答助手、设计创意辅助、医学内容生成、新材料发现、二次元内容创作、销售人员培训……百度大模型创业大赛优胜团队的项目,覆盖多个细分方向。它们共同展示了大模型应用创业的诸多特征。

首先,致力于大模型应用的创业者通常对他们所要改变的场景有深入的理解。正是由于对特定应用场景的深度理解,创业者才更能洞察这些场景中已有方案所面临的问题,从而更可能利用大模型开发出更优的解决方案。

本次大赛中获得一等奖的 ChatDOC 公司庖丁科技创办于 2017 年,成立至今的六年间,一直在做处理金融文档相关的产品,比如根据客户提供的大量的资料写出招股书。同样获得优胜奖的 ChatPPT 项目,负责人周泽安在 PPT 引擎和功能开发方面有 10 年经验,此前的创业项目口袋动画曾被 WPS 收购。

海外持续获得客户和投资的大模型创业公司类似。比如估值达到 15 亿的大模型应用公司 Jasper AI,主要用大模型的能力为客户提供营销方面的支持,其创始团队有深厚的营销背景。去年 11 月拿到 OpenAI 领投 2700 万美元的语言学习应用 Speak,创始人在高中就做出了辅助学习记忆的应用并卖了出去。

其次,创业者的策略不是在大模型的基础上构建全新的解决方案,而是使用大模型去优化原有解决方案的某个特定环节。在这个优化过程中,他们尽可能地发挥出大模型的独特优势,同时规避其仍然存在的弱点。

“我们核心不在于大语言模型,而是如何让一个人工智能胜任人类导购的一个角色。” Buysmart.AI 创始人陈历飞说,根本在于怎样让它正确地理解用户的问题,然后推荐出争取的商品。Buysmart.AI 是另一个获得百度大模型创业大赛一等奖的项目。他们采取的做法是将大模型与推荐算法结合起来,发挥其理解和处理大量信息的能力。

ChatDOC 的 CEO 林得苗说,市场上同类的智能文档产品,经常出现答非所问、自己生成答案的现象。因此他们在 ChatDOC 中会限制大模型的生成能力,要求它给出的每一个回答,都要引用原文,如果找不到合适的原文,就反馈 “没有找到”,而不是胡乱回答。

在使用大模型辅助发现新材料的幻量科技,大模型现在发挥的最大价值,是辅助构建不需要掌握代码,就可以去调用先进算法和实验的计算实验平台。“大语言模型一定程度上降低了使用软件或操作每一台仪器的成本,可以直接通过语音,去实现特定的操作。” 幻量科技创始人兼 CEO 刘雨阳说。

第三,对于大模型应用而言,虽然切换底层的大模型并不困难,但若长期使用同一大模型,可能会产生依赖性。这次参加百度大模型创业大赛的团队,不少早期都基于 ChatGPT 开发应用在海外发展,而在国内的业务,现在切换到了文心一言。

“把一个海外的模型换成一个国内模型,这个难度没有预想的那么大。我们换了之后,就改动不需要特别多,整个流程就能够跑起来。”Buysmart.AI 创始人陈历飞说。

利用大模型辅助创作二次元内容的 Genie AI 的 CEO 彭康伟也有类似的感受,从 ChatGPT 切换到文心一言上,“模型的微调和一些关键词的表述,相差并不算多,从安全和兼容中文方面来看,文心一言会更好一些”。

不过在她看来,如果长期使用一个大模型,比如 ChatGPT,想要彻底发挥它的能力,就要围绕它设定产品架构,构建代码,“时间长了切换模型是有成本的”。

这是大模型竞争中常被忽视的一个层面。大模型应用的开发者可能会对某一特定的大模型产生依赖,这就意味着那些更早步入市场、更早吸引创业者的大模型供应商,会具有更大的优势。

大模型逐步进入 AI 原生应用时代

在大模型政策落地前,绝大多数公司在推广大模型应用方面表现得相当谨慎。他们面向个人用户的产品通常处于内部测试或邀请测试的阶段,普通用户无法直接注册或使用,且各公司并不会主动投放广告来推广大模型产品,这些因素都限制了产品的传播速度。

政策落地创造的新环境,使大模型竞争转变为一场全面能力的较量:成功的关键不再仅仅是一家公司训练大模型的技术实力,还包括它洞察市场需求、开发出匹配的应用以及优秀的运营能力。

这对每一家开发大模型应用的创业公司都是考验。对于开发基础大模型的公司来说,考验还直接关系到它们建立生态系统的能力。这可能才是它们竞争力的直接体现。

李彦宏认为,“只有最好的大模型,才能长出最好的人工智能原生应用”。他说百度不久后就会推出文心大模型 4.0 版本,目标是 “百度的目标是打造好大模型的基础能力,支持好人工智能原生应用开发”。

百度在大模型生态上的投入也在持续。据了解,除了 “文心杯” 创业大赛外,百度还面向开发者推出 AI Studio 星河大模型社区、插件机制以及文心大模型 “星河” 共创计划,吸引更多人加入百度的大模型生态。

根据百度披露的数据,目前百度智能云千帆大模型平台每月都活跃的企业近 10000 家,覆盖金融、制造、能源、政务、交通等行业的 400 多个业务场景。

8 月底,百度的文心一言通过相关部门的备案,正式向公众开放。百度称,文心一言开放第一天,就回答了网友 3342 万个问题,“大量真实人工反馈有助于百度快速、高效改进基础模型。”

“我相信文心大模型将成为 AI 创业者、开发者的首选,越来越多的应用会建立在模型之上,整个生态系统将充满活力。” 李彦宏说。文章来源地址https://www.toymoban.com/news/detail-728416.html

到了这里,关于大模型应用时代,百度开了个头的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • AIGC基础:大型语言模型 (LLM) 为什么使用向量数据库,嵌入(Embeddings)又是什么?

    嵌入: 它是指什么?嵌入是将数据(例如文本、图像或代码)转换为高维向量的数值表示。这些向量捕捉了数据点之间的语义含义和关系。可以将其理解为将复杂数据翻译成 LLM 可以理解的语言。 为什么有用?原始数据之间的相似性反映在高维空间中对应向量之间的距离上。

    2024年02月21日
    浏览(60)
  • 大型语言模型LLM的基础应用

    ChatGPT是由人工智能研究实验室OpenAI在2022年11月30日发布的全新聊天机器人模型,一款人工智能技术驱动的自然语言处理工具。它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案

    2024年02月09日
    浏览(52)
  • AIGC大模型时代下,该如何应用高性能计算PC集群打造游戏开发新模式?

    ACT | SIM | ETC | FTG | RAC AVG | RPG | FPS | MUG | PUZ ACT、SIM、ETC、FTG、RAC、RTS、STG、AVG、RPG、FPS、MUG、PUZ、SLG、SPG等游戏类型,需要高性能的计算机来支持运行。为了满足这些游戏的需求,国内服务器厂商不断推出新的产品,采用液冷散热技术,大模型构建和PC集群一体机等技术来提高

    2024年02月09日
    浏览(56)
  • LangChain大型语言模型(LLM)应用开发(五):评估

    LangChain是一个基于大语言模型(如ChatGPT)用于构建端到端语言模型应用的 Python 框架。它提供了一套工具、组件和接口,可简化创建由大型语言模型 (LLM) 和聊天模型提供支持的应用程序的过程。LangChain 可以轻松管理与语言模型的交互,将多个组件链接在一起,以便在不同的

    2024年02月15日
    浏览(48)
  • AnalyticDB(ADB)+LLM:构建AIGC时代下企业专属Chatbot

    这个春天,最让人震感的科技产品莫过于ChatGPT的横空出世,通过大语言模型(LLM)让人们看到了生成式AI能实现到和人类语言高度相仿的语言表达能力,AI不再遥不可及而已经可以走进人类的工作和生活,这使得沉寂一段时间的AI领域重新焕发了能量,无数的从业者正趋之若鹜

    2024年02月09日
    浏览(43)
  • LangChain大型语言模型(LLM)应用开发(六):Agents

    LangChain是一个基于大语言模型(如ChatGPT)用于构建端到端语言模型应用的 Python 框架。它提供了一套工具、组件和接口,可简化创建由大型语言模型 (LLM) 和聊天模型提供支持的应用程序的过程。LangChain 可以轻松管理与语言模型的交互,将多个组件链接在一起,以便在不同的

    2024年02月16日
    浏览(44)
  • LangChain大型语言模型(LLM)应用开发(三):Chains

    LangChain是一个基于大语言模型(如ChatGPT)用于构建端到端语言模型应用的 Python 框架。它提供了一套工具、组件和接口,可简化创建由大型语言模型 (LLM) 和聊天模型提供支持的应用程序的过程。LangChain 可以轻松管理与语言模型的交互,将多个组件链接在一起,以便在不同的

    2024年02月12日
    浏览(46)
  • 自然语言处理从入门到应用——LangChain:模型(Models)-[大型语言模型(LLMs):缓存LLM的调用结果]

    分类目录:《大模型从入门到应用》总目录 LangChain系列文章: 基础知识 快速入门 安装与环境配置 链(Chains)、代理(Agent:)和记忆(Memory) 快速开发聊天模型 模型(Models) 基础知识 大型语言模型(LLMs) 基础知识 LLM的异步API、自定义LLM包装器、虚假LLM和人类输入LLM(

    2024年02月16日
    浏览(54)
  • Graph + LLM图数据库技术如何助力行业大语言模型应用落地

    随着 AI 人工智能技术的迅猛发展和自然语言处理领域的研究日益深入,如何构建强大的大语言模型对于企业来说愈发重要,尤其是在特定行业领域中。 图数据库作为处理复杂数据结构的有力工具,为企业构建行业大语言模型提供了强大的支持。本文将探讨图数据库和图技术

    2024年02月22日
    浏览(50)
  • 人工智能的新篇章:深入了解大型语言模型(LLM)的应用与前景

    项目设计集合(人工智能方向):助力新人快速实战掌握技能、自主完成项目设计升级,提升自身的硬实力(不仅限NLP、知识图谱、计算机视觉等领域) :汇总有意义的项目设计集合,助力新人快速实战掌握技能,助力用户更好利用 CSDN 平台,自主完成项目设计升级,提升自

    2024年02月04日
    浏览(63)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包