三个月诞生79个基础大模型,企业选用大模型需要注意些什么?

这篇具有很好参考价值的文章主要介绍了三个月诞生79个基础大模型,企业选用大模型需要注意些什么?。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

自从ChatGPT横空出世,各类大模型层出不穷,竞争也日渐激烈,可谓“乱花渐欲迷人眼”。

随着大公司的入场,无疑给创业公司带来了降维打击,创业公司随时可能倒掉,造成项目烂尾。

我也一直在关注大模型领域的最新进展,但当每天都有海量信息袭来时,我认为具有自己的独立思考框架、并持续保持是十分重要的,所以这里我也把近期的信息,并结合自己的思考分享给大家。

其实,相较于To C市场,我更关注To B市场,因为随着大模型逐渐进入深水区,向各个行业渗透也已经成为了必然趋势。

可预见地,未来所有的企业都会强依赖大模型,所有的产品都会基于大模型来开发。从长远考虑,大模型如何对商业世界产生真正的影响?才是下个阶段我们更应该关注的焦点。

一、《AI大模型技术能力评估报告》解读

目前,国内典型大模型包括:文心(百度)、M6(阿里)、盘古(华为)、ChatGLM(智谱科技) 、星火(科大讯飞)、日日新(商汤)等。

全球领先的IT市场研究和咨询公司IDC最新发布了《AI大模型技术能力评估报告,2023》,中国市场14个主流厂商参与了本次调研,IDC选取了9家大模型技术厂商进行重点研究,通过用户访谈调研,从用户关注的技术能力、产品功能、生态服务等方面进行了全面评估。

我之所以会关注这个报告,基于如下几点原因:

  1. 基于目前的国际态势,我认为国内一定会跑出一至两个大模型,可类比百度之于谷歌,阿里云之于AWS,这是我始终关注国产大模型进展的原因。
  2. IDC是国际权威咨询机构,行业认可度较高,所以该报告是具有权威性的。
  3. 本报告不单单基于技术角度对大模型进行评估,涵盖了算法能力、行业覆盖度、生态合作等等指标。我一直相信,不能闭门造车式的搞技术,曲高和寡往往意味着不切实际,技术终究是要服务于商业、服务于社会的。

我们再来具体看看IDC是怎么评估大模型的:

  1. IDC将大模型分为三层,即服务生态、产品技术以及行业应用。
  2. 对每一层的能力进行测评,主要考察指标为:算法模型、通用能力、创新能力、平台能力、安全可解释、大模型的应用行业以及配套服务和大模型生态等10余个指标(具体包括36项细颗粒度的评估标准),每个指标有1分-5分五个层级,得分越高代表厂商大模型技术能力越强,最终评估结果通过雷达图展示。
  3. 在大模型的选择上,IDC选取了中国市场9家大模型技术厂商进行重点研究,分别为阿里巴巴、百度、第四范式、科大讯飞、澜舟科技、云从科技、智谱AI、中国电信智科以及中科闻歌。除此之外,IDC还观察到了360、MiniMax、华为、商汤科技、腾讯等大模型。

ps:IDC也表示,会持续更新测评,涵盖更多技术厂商。

二、文心大模型的优异表现值得关注

值得一提的是,百度的文心大模型在此次评估中的表现十分亮眼,引起了我的注意。

其具体的表现如下:

七项核心指标满分(5分):算法模型、通用能力、创新能力、平台能力、生态合作、行业覆盖、能源行业;

三项国内唯一满分(5分):算法模型、行业覆盖、能源行业;

五项指标4分:安全可解释、服务能力、金融行业、工业行业、医疗行业。

下面两张图分别是文心大模型与其他国产模型的横向对比,以及文心大模型自身在各个指标中的评分:

三个月诞生79个基础大模型,企业选用大模型需要注意些什么?,AIGC,AIGC,AI写作,AI编程,langchain,文心一言,大模型

三个月诞生79个基础大模型,企业选用大模型需要注意些什么?,AIGC,AIGC,AI写作,AI编程,langchain,文心一言,大模型

这里我想额外说明一下“算法模型”和“行业覆盖”两个指标。

产品技术能力中,“算法模型”维度是最重要的,是大模型能力最为核心的要素,也是决定大模型应用效果的根本所在。只有通过算法模型技术的突破,实现具有通用效果优势的大模型底座,才能支撑更广泛的行业覆盖,才能使各行各业充分享受技术突破带来的红利,破解AI落地门槛高的困境。

在应用能力中,行业覆盖的广度是当下大模型厂商最为关注的指标。“行业覆盖”通过企业级客户数量和落地行业数,体现了大模型在产业落地上的实力,是大模型效果通用领先性、行业结合能力两方面的综合体现。

“算法模型”“行业覆盖”两个核心指标有其内在的关联性,行业覆盖的广度是算法模型通用领先性的集中体现,也将为算法模型能力持续提升提供源源不断的正向反馈,形成持续迭代提升的飞轮。

文心大模型获得了算法模型维度的唯一一个满分,体现了百度在大模型核心技术上的先发优势。百度自2019年开始深耕预训练模型研发,先后发布知识增强文心系列模型。近期的文心大模型3.5版本实现了基础模型升级、精调技术创新、知识点增强、逻辑推理增强等,新版本在效果、功能、性能都有了全面提升。

另外,除了本次的评估报告,其他多个公开测评显示,文心大模型3.5版支持下的文心一言中文能力突出,甚至有超出GPT-4 的表现;综合能力在评测中超过ChatGPT,遥遥领先于其他大模型。

在SuperCLUE最新测评榜单中,文心一言已经超越GPT3.5turbo,也超越GLM130B。

三个月诞生79个基础大模型,企业选用大模型需要注意些什么?,AIGC,AIGC,AI写作,AI编程,langchain,文心一言,大模型

三、企业用大模型,要如何选择

基于《AI大模型技术能力评估报告》的结果,引发了我对于大模型选型问题的思考,既然上面我们说到:未来所有的企业都会强依赖大模型。

那么我们是应该选择商用模型还是开源模型,选择与大厂合作还是与初创公司合作?这些就成了绕不开的问题。

我先说我的结论:选择大厂的商用模型是最优选择。原因如下:

1、时间是最宝贵的资源

无论是对于刚起步的公司,还是已经具备一定规模的公司,想要在如今日渐激烈的市场谋求发展,最重要的资源是什么?是时间,这是一场和时间赛跑的游戏。

你这边在等一个开源模型从GPT-3的能力进化到GPT-3.5,而你的对手公司直接上了具有GPT-4能力的商用模型,无论从产品能力或用户体验上直接碾压你。所以从这个角度来看,选择商用大模型,是你取得先发优势的唯一选择。

2、对于To B大模型来说,行业经验远比参数重要

正如前文所说,闭门造车式的关注参数、规模是没有意义的,对于To B场景,积累的行业经验往往才是起到决定性作用的。

就我目前收集到的信息来看,百度在这个方面已经处于领跑地位,过去几个月,百度智能云在化工、制造、能源及汽车等大工业制造板块频繁有新的动作。比如,7月初,华晨宝马宣布与百度战略合作,双方称将共享优势资源,探索 AI 技术与汽车制造业全域场景的融合创新。上月,中国石化与百度战略合作协议,在行业人工智能基础设施建设、数字化转型升级与大模型等新技术创新等六大领域展开合作。电力行业里,5月,百度与南网总调签署备忘录,双方要共推AI与电力调度融合创新。

这也意味着,从各方面来说,百度的文心大模型无疑都已经基于其先发优势,处于了领跑地位。文章来源地址https://www.toymoban.com/news/detail-603651.html

到了这里,关于三个月诞生79个基础大模型,企业选用大模型需要注意些什么?的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【AI 模型】首个 Joy 模型诞生!!!全民生成 Joy 大片

    接上一篇文章 “只要10秒,AI生成IP海报,解放双手”,这次是全网第一个“共享joy模型”,真的赚到了! 经过这段时间无数次的探索、试错、实验,最终积累了非常多的训练经验,在不同IP角色的训练上实际上需要调试非常多的参数以及素材。本次成功完成了Joy的Lora模型,

    2024年02月08日
    浏览(51)
  • 企业Web安全治理的十三个要点

    因为今天刚汇报了23年H1的工作内容,H1的内容和之前在CSDN发布帖子,但是经过了整理后的。基本上是比较全面和精练的。所以这里再列举一下相关情况,即安全治理的几个要点: 其实基本上的企业Web安全治理内容我总结为如下: 安全提升动因:解决业务增长中安全隐患问题

    2024年02月12日
    浏览(40)
  • springboot基础(79):通过pdf模板生成文件

    通过pdf模板生成文件。 支持文本,图片,勾选框。 本章代码已分享至Gitee: https://gitee.com/lengcz/pdfdemo01 先使用wps软件制作一个docx文档 将文件另存为pdf文件 使用pdf编辑器,编辑表单,(例如福昕PDF阅读器、Adobe Acrobat DC) 不同的pdf编辑器使用方式不同,建议自行学习如何使用p

    2024年02月10日
    浏览(40)
  • 自学Python,需要注意哪些?

    在学习Python之前,你不要担心自己没基础或“脑子笨”,我始终认为,只要你想学并为之努力,就能学好,就能用Python去做很多事情。在这个喧嚣的时代,很多技术或概念会不断兴起,我希望你能沉下心来去学习,不要急于求成,一步一个脚印。当你把某个技术学好、学精后

    2024年01月24日
    浏览(42)
  • 概率论需要注意的点

    超几何分布是H( n N M)的顺序,其中 n表示抽取的数量,N表示总体数量,M表示其中次品的数量。超几何分布将-先后不放回取n个中,求取得的球里面白球的概率= 任取n个,然后算里面白球的数量。这两个是相同的。 超几何分布中,当抽取的个数n远远小于N的时候,这个时候超几

    2024年02月04日
    浏览(40)
  • 使用低代码开发,需要注意哪些?

    低代码平台的历史相对较短,大约始于 2000 年初,源于快速应用程序开发工具。随着低代码平台和工具的日益普及和优势,它不断发展以满足各种领域和角色的需求。 本文将研究各种低代码和无代码应用程序开发方法、业务用例、挑战和未来预测等。 低代码是一种软件开发

    2024年02月15日
    浏览(43)
  • 数电中需要注意的问题

    加法器 { ①和: 1 , 2 , 4 , 7 ②向高位的进位: 3 , 5 , 6 , 7 加法器quad begin{cases} ①和:1,2,4,7\\\\ ②向高位的进位:3,5,6,7 end{cases} 加法器 { ① 和: 1 , 2 , 4 , 7 ② 向高位的进位: 3 , 5 , 6 , 7 ​ 减法器 { ①差: 1 , 2 , 4 , 7 ②向高位的借位: 1 , 2 , 3 , 7 减法器quad begin{cases} ①差:

    2024年02月03日
    浏览(32)
  • 中国电信开源星辰AI大模型:央企中首个完成LLM研发和开源的选手诞生

    丰色 发自 凹非寺 量子位 | 公众号 QbitAI 没想到啊,开源大模型家族里,居然挤进来一位 特别的选手 : 来自央企,身份为运营商。 具体是谁? 中国电信 。 所谓“不鸣则已,一鸣惊人”: 中国电信集团成立的中电信人工智能科技有限公司凭借全自研算法、精心打造的高质量

    2024年02月21日
    浏览(48)
  • 手机APP测试需要注意的问题

    1、前言 APP测试是一个广泛的概念,根据每个APP的应用场景不一样,测试的方向也略微的不同,在测试过程中需要灵活应用自身所知的测试手段。手机不同的功能对应着 2、安装测试 软件在不同操作系统(Android系统和IOS系统)上是否正常安装 软件在不同版本的操作系统(如

    2024年02月04日
    浏览(50)
  • 鸿蒙APP上线需要注意的问题

    在将鸿蒙(HarmonyOS)应用上线的过程中,开发者需要注意一系列问题,以确保应用能够成功发布并在用户设备上正常运行。以下是上线过程中需要注意的一些关键问题,希望对大家有所帮助。北京木奇移动技术有限公司,专业的软件外包开发公司,欢迎交流合作。 1.鸿蒙版本

    2024年02月02日
    浏览(43)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包