为什么大模型突然间火了
大模型是今年4月份chatgpt火了之后,公司开始意识到这个东西可能有点东西,为此组织预研。本身公司是安防科技公司,先是预研的cv领域的大模型。总体而言,视觉大模型在行业内落地目前都在预研中,没有语言类大模型给人带来那么强烈的震撼感。
在B站看到陆奇的演讲后,自己整理下大体思路,记录自己的收获。
一、社会变革
整张胶片分析的比较全面,从人类环境层面讲述了新一代的大模型能够将信息整合,进而实现分析和思考,指导人的行为。并描述了人工智能的大体发展历程,一开始的人工智能,主要对网络的信息进行整合,类似阿尔法狗的这样的。后来随着视频领域人工智能发展,在视觉场景进行落地,进而有了边缘计计算、元宇宙等概念,最后大模型的出现直接有可能实现真正的人工智能,即通用人工智能(具有分析推理的智能)。
二、社会影响
在整体的社会组织中有各种形式的工作形式和生活方式,技术上对社会的影响正如胶片所描述。目前城市中在数字化中,信息化建设基本完成,目前数字中模型在逐渐完善(即目前的人工智能场景应用)。大模型到来后,则是产生更进一步的影响,则是AI经济,可以全面替代脑力和体力劳动,也许真有可能达到三体的一些水平。
三、OpenAI
大模型一直在搞(大模型即参数在1B以上),只有OpenAI的GPT3.5模型具有推理和分析能力,就像神经细胞多了,突然从哺乳动物进化成人类了。此处必须给OpenAI公司点个赞,听说人家一上来本来就是搞技术,没想过挣钱的事。(有钱人真好)
当意识到大模型这么好用时,OpenAI开始推广其应用,在国外与其合作的公司立马春笋一样多了起来,在各个场景中进行应用。也会发现现在技术大佬常常跳出来,开始自己搞大模型,有算力和有数据(这俩你要还真有钱,还是一堆钱那样的),此外大模型的技术壁垒很高,不是你有了框架和代码就能训练一个好模型,这碗饭如果能吃起来,还挺香。
四、具备的能力
目前科技公司开始加足马力在搞大模型,构建自己的技术生态,无论是商汤、华为、百度、阿里等等。毕竟现在“群模乱舞”,谁能异军突起,也许引领下一个技术浪潮。针对我们研发人员,如果去搞,掌握的技术还是比较多,正如胶片所述,涉及的领域挺多,并不一定大家都在搞算法,研究算法,算法落地才是根本啊。
五、结论
大模型确实很牛,技术门槛有点高,如果想切入赛道,研发人员需要重新学习,毕竟不想现在的一些检测分类那么简单,喂上数据,修改配置文件,启动训练,模型基本够用。现在大部分公司还是在搞基于大模型的垂直应用,比如基于语言的大模型的知识搜索、简单问答、优化智能推荐等等,还有图像领域的通用视觉模型实现小样本的优化,这些技术点还是可以落地的。文章来源:https://www.toymoban.com/news/detail-609072.html
在学习时,一定主要技术的生态,从理论到代码逻辑,从训练、推理、测试、落地等多方位考虑学习,这样自己能较快实现方向的切换,重点自己要找准一个技术路线,踏踏实实去训练优化落地等等。文章来源地址https://www.toymoban.com/news/detail-609072.html
到了这里,关于为什么大模型突然间火了的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!