All in AI,现在开始算不算太晚?

这篇具有很好参考价值的文章主要介绍了All in AI,现在开始算不算太晚?。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

编者按:目前大模型近乎可以帮助人类处理方方面面的事情,如对话、写文章、写代码等等。在大模型“狂飙”趋势下,想要从事AI领域的小伙伴可能会犹疑:现在进入AI领域会不会已经太晚了?

本文作者结合自身转型经历和对AI市场的研判,阐述了进入人工智能领域从来都不会太晚,There’s no time like the present

本文还详述了,在“AI渗透一切”的时代,如何快速掌握必要的AI知识,以及如何在AI时代找到自身职业定位。

以下是译文,Enjoy!

作者 | swyx

编译 | 岳扬

我的一位开发者朋友最近跟我说:“如果我现在是20岁,我会放下一切 all in 人工智能。”但他已经花了十多年的时间去学习专业知识、积累社交人脉和良好的声誉,已经达到他目前所在领域的最高水平。因此,他现在还得留在原来的领域。另一位较年长的大学时期朋友是一家上市科技初创公司的高管。他对现在的工作得心应手,拥有近乎完美的简历,他之前的职业经历也是令人羡慕的岗位。然而,他现在正在转变方向,因为正如他告诉我的那样,“生命是短暂的”,他不想在结束时想 “如果当时…”。

最近几天,我同从事技术工作和非技术工作的朋友都有过类似上面这样的对话。虽然我很想让这篇文章关注具体的技术发展和分享飞速发展的最新技术,但我认为有必要花一期来讨论职业转型话题,因为这正是我凑巧特别有资格能够讨论的话题。

01 三十多岁时的转折期

我还记得在我30岁第一次进行职业转型时有多么可怕,当时我已经在金融行业工作了6-7年,我从16岁起就一直想要从事金融行业,穿梭于世界各地,向CEO们提问,并帮助管理一家世界顶级对冲基金的10亿美元资产。看起来我很厉害,但我深知我的内心并不满足,这不是我的最终目标。与从无到有创造出一些东西相比,让一些捐赠基金和养老金的数字变得更加大,就显得微不足道了。我决定从金融行业转向软件工程(和开发者关系) 。接下来发生的大家都已经知道了[1]。

六到七年后,我又一次转变了我的职业。我认为从软件工程师(SWE)到人工智能(AI)的转变几乎和从金融到软件工程师的转变一样大,它们只是表面上看起来相似(都是计算机领域),但是需要大量的新知识和实践经验才能使工作变得有效率。我的转变策略和上次一样:尽可能开始的六个月每个晚上和周末学习,以确保我对要进入的领域拥有浓厚的兴趣(注释1,文末有解释,后同),而且我能够取得有意义的进步,然后就开始与过去say goodbye/破釜沉舟/全力以赴,并告诉大家我进入了这个领域[2](注释2)。

但那只是适用于我自己的情况。每个人的情况可能都会不同。我相信如果你愿意,可以找到如何做到成功转行的方法。这篇文章面向的对象是那些想要获得足够自信去做出决定的人。

我认为,在科技职业的选择中存在很多隐藏的年龄歧视(ageism)和沉没成本误区[3](sunk cost fallacy)。因此,以下是我快速列出的一些理由,可以说明你不会因为年龄问题而无法转行

02 哪怕你年龄已经很大 仍应进入AI领域的原因如下

2.1 人工智能极大的潜力/发展速度

  • 杰夫·贝索斯(Jeff Bezos)在30岁时辞去金融工作,创办了亚马逊。
  • 他这样做是因为1994年互联网使用量每年增长2300%。
  • 通用技术[4](general purpose technologies)(注释3)的推广需要数十年的时间。
  • 想象一下,如果你可以在2000年或2010年成为技术领域的“后浪”,却得出结论认为“为时已晚”而没有进入互联网行业。
  • 自1月以来,ChatGPT的使用量增长了1000% [5](注释4)。

2.2 上手AI需要的时间比我们想象的要短

  • 如果不是通过获取博士学位的路径进入机器学习领域,需要先参加 Andrew Ng (吴恩达)在 Coursera 上的课程[6]三个月左右,然后就会意识到仍需要数年的自学和实践经验才能在机器学习领域做出有趣的事情。
  • 但目前我们掌握生成式AI的学习路径正在变得越来越简单。(注释5)
  • Jeremy Howard 的 fast.ai 课程[7]从 2016 年开始就宣称让学生在七周内进入人工智能领域。到了 2022 年,他已经通过十节 90 分钟的课程带领学员重新实现 Stable Diffusion[8]。Suhail Doshi 在 2022 年 6 月参加了这门课程,到了 11 月就推出了 Playground.ai[9]。
  • 这在一定程度上是由2017年推出的Transformer架构推动的,自那以后它几乎进入了每个 AI 领域[10],并提供了一个强大并且灵活的 baseline,从而使之前的架构知识变得可有可无。因此,没有数十年的研究需要学习,只需要学习最近五年的内容

All in AI,现在开始算不算太晚?

https://www.stateof.ai/2018

  • 有一些读者询问了关于AI涉及到的数学问题。AI 是否“只是使用了矩阵乘法(matrix multiplication)” [11]存在争议,如果你愿意,可以在大学线性代数和微积分课程中学习矩阵乘法,但我的回答是你不必这样做,现在的那些AI开发框架(比如 Pytorch) 可以帮助你进行任何反向传播(backpropagation)和矩阵操作(matrix manipulations)。
  • 当然,走捷径并不能让你变成能够推动技术发展的博士。 但看看最顶尖AI研究员的职业生涯,你也可以了解需要多长时间才能达到最高水平。Yi Tay 在 Google 贡献或领导完成了许多最新的 LLM 成果,但你可能会惊讶地发现他才获得博士学位约 3.3 年的时间。Ashish Vaswani 在发表 Transformer 论文时距离博士毕业也只有 3 年,而 Alec Radford 发表 GPT 和 GPT-2 论文时刚本科毕业 2 年。
  • 类似这样的职业轨迹在物理、数学、医学等更成熟的领域不会发生,因为它们的 “FOOM(Fast Onset of Overwhelming Mastery) ” 年代[12]已经过去了几个世纪,而 AI 的“foom” 正在明显地发生。
  • 这些话都是为了说明:这仍然是一个非常年轻的领域,在20年后,没有人可能会关心你觉得自己“晚入行”。

2.3 除了成为专业的机器学习领域的研究员,还有许多领域可以选择

  • Prompt和大模型能力研究: Riley Goodside[13] 的职业生涯在 2022 年急剧变化,通过在推特上发布GPT-3的使用技巧,他从 Grindr 的数据科学家变成了世界上第一位高级Prompt工程师[14],他还发现并普及[15]“提示注入(prompt injection) ”这种重要的 LLM 安全问题。自那以后,许多人已经意识到寻找 GPT-3 和 GPT-4 的有趣使用案例在社交媒体上很受欢迎。
  • 软件工程领域: 最近,Whisper.cpp 和 LLaMA.cpp 激发了许多人对在用户终端上运行大型模型的兴趣[16]。我听了 Georgi Gerganov 在 Changelog 上的采访[17],并得知他在 2022 年 9 月自称“非 AI 信仰者”,只是为了好玩而将 Whisper 移植到了 C++。LLaMA.cpp 的发展速度比 Stable Diffusion 还要快[18],而 Stable Diffusion 已经是有史以来增长最快的开源项目之一[19]。尽管没有进行模型训练,但 Georgi 的软件工程专业知识使得这些基础模型更加易于接入。Harrison Chase 的 Langchain[20] 通过构建首个面向所有开发人员的提示工程框架,将Prompt和软件的改进融合到预训练的LLM模型中,吸引了大量关注。从 Guardrails 到 Nat.dev 的一系列 LLM 工具都有助于弥合这些模型从学术界到商业应用的差距。ChatGPT本身在很大程度上是与GPT 3.5系列模型一起交付的用户体验创新,这对前端/UI开发者来说是个好消息。
  • AI技术产品化: 说到 Stable Diffusion,Emad Mostaque 直到 2019 年都是一名对冲基金经理[21],似乎除了为他的儿子进行“literature review of autism and biomolecular pathway analysis of neurotransmitters[22]”相关的研究之外之前并没有任何 AI 经验。但他在 2020 年参加 EleutherAI 社区后意识到 Stable Diffusion 这样的东西是可能存在的,并找到了海德堡大学 CompVis 组[24]的 Patrick 和 Robin[23],提供了大约 60 万美元来训练和交付了2022年第二或最重要的AI产品。没有人想去审查谁做了什么,但一个前对冲基金经理通过发现机会并将财务(和组织架构)杠杆应用于时机已到的想法(ideas whose time had come)而获得大量回报是有道理的。Nat Friedman 已经公开表示,多年的研究造成的能力过剩[25]还没有被足够多的创业公司消化,看起来像 Dave Rogenmoser 这样愿意早早跳上这班车的创业人,在两年内将 Jasper 的 ARR(会计收益率) 从零增长到了 7500 万美元[26],将会获得不成比例的回报。

现有企业和各个垂直领域的创业公司都在拥抱人工智能,这表明未来将是“AI渗透一切”的时代,因此理解基础模型可能是达到目的(利用它们)的一种手段,而不是目的本身(训练模型或对安全性和感知能力进行思考)少想一点你自己和你未来的潜在方向,不是“转行研究AI”,而是在你已经感兴趣或精通的领域 “学习如何利用它”。

我最后一个与年龄相关的呼吁是通用的——挑战自己对大脑是有益的。人们普遍认为神经可塑性(Neuroplasticity)在25岁以后就会停止,但这是有争议[27]的。更为广泛的共识是,持续学习有助于建立认知储备(cognitive reserve) ,有助于避免像痴呆和阿尔茨海默病这样的恶性神经退行性疾病。

你是否正在处理任何类似于了解AI的工作,并想方设法将其运用于实际应用中的挑战?

03 我是如何学习人工智能的

我已经完成了fast.ai的课程内容,但也在持续关注我自己筛选的Twitter列表中的从业者[28],并将笔记放入我的公开地GitHub AI仓库[29]和Latent Space Discord中[30]。大多数比较重要的新论文 在它们被发布的那周我就开始阅读,我还尽可能地运行获得很多点赞的项目和产品的代码或阅读它们的代码。我们即将在播客上发布“Fundamentals 101”系列内容,其中包括AI基础知识,这迫使我去阅读更多论文并了解一些我们今天认为理所当然的事情的历史(注释6)。

All in AI,现在开始算不算太晚?

https://github.com/sw-yx/ai-notes/blob/main/Resources/Good%20AI%20Podcasts%20and%20Newsletters.md

注释:

  1. 在两次职业转型中,我都并不是从零开始 - 我在13岁时就接触过BASIC编程,在26岁时作为期权交易员工作时,写了一些极其简单的自然语言处理代码来解析经纪商的定价 - 我希望我能向你展示,但已经过去太久了,这些内容已经找不到了。

  2. 在社区中公开发表学习过程内容可以达到人类最快的学习速率 - L((PN)^2)![31]

  3. 这股AI浪潮是如此之大。不要相信我的话,听听比尔·盖茨的话[32],他说这是自图形用户界面以来最重要的技术进步。

  4. 寒冬将至。在某一天,这个AI盛夏将结束,AI寒冬[33]将再次到来。了解这股AI浪潮的重要性在于它可能会在任何寒冬中存活下来,就像2001年经济衰退后互联网行业只是短暂地停顿了一下。

  5. 强制使用生成式AI(Generative AI) 这个术语会让我们感到不愉快,因为我们都认为它被过度炒作了[34]…但是目前还没有找到更好的替代词。

  6. 再次强调,在公开的社区发表学习内容很重要,因为担心影响我的个人名誉,我会尽可能正确,并让我在犯错时感受到额外的压力。

END

参考资料

[1]https://learninpublic.org/

[2]https://www.swyx.io/learn-in-public

[3]https://thedecisionlab.com/biases/the-sunk-cost-fallacy

[4]https://en.wikipedia.org/wiki/General-purpose_technology

[5]https://twitter.com/swyx/status/1640561992472866816

[6]https://www.coursera.org/specializations/machine-learning-introduction

[7]https://www.fast.ai/posts/2016-10-08-course-background.html

[8]https://www.fast.ai/posts/part2-2022.html

[9]https://twitter.com/Suhail/status/1591813110230568963?ref=hackernoon.com

[10]https://twitter.com/karpathy/status/1468370605229547522

[11]https://twitter.com/search?q=%22just%20matrix%20multiplication%22&src=typed_query&f=top

[12]https://www.latent.space/p/ok-foomer

[13]https://www.linkedin.com/in/goodside/

[14]https://twitter.com/swyx/status/1616541173996482560?lang=en

[15]https://twitter.com/goodside/status/1617735459026915329

[16]https://news.ycombinator.com/item?id=35111646

[17]https://changelog.com/podcast/532#transcript-8

[18]https://twitter.com/ggerganov/status/1635636358126370817

[19]https://a16z.com/2022/11/16/creativity-as-an-app/#section–1

[20]https://langchain.com/

[21]https://en.wikipedia.org/wiki/Emad_Mostaque

[22]https://twimlai.com/podcast/twimlai/stable-diffusion-generative-ai/

[23]https://research.runwayml.com/the-research-origins-of-stable-difussion

[24]https://github.com/CompVis

[25]https://stratechery.com/2022/an-interview-with-daniel-gross-and-nat-friedman-about-the-democratization-of-ai/

[26]https://techcrunch.com/2022/10/18/ai-content-platform-jasper-raises-125m-at-a-1-7b-valuation/

[27]https://www.goodtherapy.org/blog/change-is-a-choice-nurturing-neuroplasticity-in-your-life-0930154

[28]https://twitter.com/i/lists/1585430245762441216

[29]https://github.com/sw-yx/ai-notes/

[30]https://discord.gg/xJJMRaWCRt

[31]https://www.swyx.io/big-l-notation

[32]https://www.gatesnotes.com/The-Age-of-AI-Has-Begun

[33]https://en.wikipedia.org/wiki/AI_winter

[34]https://www.latent.space/p/why-prompt-engineering-and-generative

本文经原作者授权,由Baihai IDP编译。如需转载译文,请联系获取授权。

原文链接

https://www.latent.space/p/not-old文章来源地址https://www.toymoban.com/news/detail-437085.html

到了这里,关于All in AI,现在开始算不算太晚?的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 《从程序员到架构师》:从现在开始培养架构思维,一点都不晚

    《从程序员到架构师》:从现在开始培养架构思维,一点都不晚 尽管大家都明白软件架构非常重要,但是能够真正理解并应用软件架构的核心思维去解决实战的商业项目,确实大多数程序员所欠缺的。本文将从一个全新的视角,重新带领大家了解下程序员到架构师的进阶以及

    2024年02月06日
    浏览(53)
  • 听说现在流行卷应用?开发者们都开始调用文心API开发了?!

    随着大模型的涌现,我们喜悦于其远远超越小模型的性能,但又不得不面临大模型开发难的困境,训练难、微调难、部署难,开发者难以将其投入实际生产,不仅面临资源的限制,更面临高精数据难寻、时间成本过高等问题。 为了让平台更多开发者可以进行大模型开发, 体

    2024年02月09日
    浏览(39)
  • 恐怖的低代码平台,我 All in 了!

    Hello,各位老铁,相信不少人都听过低代码平台,却一直没有一个很清晰明确的了解和认知。 那么先给大家科普一下低代码平台是什么吧!老规矩,请Chatpgt给我们介绍一下: 简单的来说,低代码平台是一种软件开发工具,旨在简化应用程序的开发流程。它们使用图形化界面

    2023年04月19日
    浏览(40)
  • 成为数字游民,他们为何「All in Web3」?

    成为数字游民,他们为何「All in Web3」? “早上好,夜之城。” 赛博朋克承载着一代人对未来世界的遐想。今年上映的「赛博朋克:边缘行者」中,主人公大卫面临着不夜城旧有制度的高压和控制,对旧有秩序不断发起冲击,“总有一天你会站上荒坂塔的顶端” 成为他前行

    2024年02月02日
    浏览(39)
  • 机器人SLAM导航学习-All in one

    参考引用 张虎,机器人SLAM导航核心技术与实战[M]. 机械工业出版社,2022. 本博客未详尽之处可自行查阅上述书籍 移动机器人激光SLAM导航(文章链接汇总) 1. ROS 入门必备知识 ROS学习笔记(文章链接汇总) 2. C++ 编程范式 《21天学通C++》读书笔记(文章链接汇总) 3. OpenCV 图像

    2024年02月16日
    浏览(40)
  • All-in-one 安装openstack实验记录

    目录 前言: 实验环境: 操作步骤: 工欲善其事必先利其器,学习私有云openstack,首先就需要如何学会搭建他,我会通过两种的方法去搭建,言归正传,直接进入安装 一台最小化安装的虚拟机(操作系统版本centos7.9) 内存8G,CPU4个 100G硬盘 IP:192.168.101.30 Openstack版本:stein [ro

    2024年01月17日
    浏览(39)
  • 李志飞 All in AGI,出门问问大模型来了!

    作者 | 唐小引 头图 | 由作者使用出门问问言之画生成 出品 | CSDN(ID:CSDNnews) 大模型进入百模大战唯快不破之时,矢志 Build AGI and make AGI accessible 的李志飞的产品比要组公司拉团队的王小川来得还更快些。 北京时间 4 月 20 日,出门问问创始人李志飞在北京嘉瑞文化中心正式

    2024年02月03日
    浏览(49)
  • USACO24Bronze 游记兼 TJ All in Once

    我没有其他组别的号了。所以只能写 Bronze 的游记了。 如果行的话,下一次我会写 Silver 的。 一开始看了看三道题,T1T2 感觉都很不可做,直奔 T3。 一看 T3(Bessie 很 nb,会各种各样的东西,会科学,会魔法,今天我们发现她会分身术),不就是个二分吗?秒杀。 好的,现在

    2024年02月19日
    浏览(36)
  • SD WebUI 扩展:prompt-all-in-one

    sd-webui-prompt-all-in-one 是一个基于 Stable Diffusion WebUI 的扩展,旨在提高提示词/反向提示词输入框的使用体验。它拥有更直观、强大的输入界面功能,它提供了自动翻译、历史记录和收藏等功能,它支持多种语言,满足不同用户的需求,尤其给英文不好但又想玩 AI 绘画的用户带

    2024年02月12日
    浏览(70)
  • 新一代分布式融合存储,数据场景All In One

            2023年5月11日,浪潮信息全国巡展广州站正式启航。会上,重磅发布新一代分布式融合存储AS13000G7,其采用极致融合架构设计理念,实现同一套存储满足四种非结构化数据的“All In One”高效融合,数据存力提升300%,IO性能提升100%;同时,实现四种非结构化协议无损

    2024年02月13日
    浏览(34)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包