随着以 ChatGPT 为代表的 AIGC(AI-Generated Content)技术的极速普及、以及 AI4S(AI for Science)从愿景走向流行,不同领域、不同背景的人们以一种前所未有的方式连接在了一起,共同经历着知识结构、技术体系、产业格局等方方面面的大重构。很多人开始问我们发起 NBHub 的初衷和整体思考、进而问如何更好地促进合作与碰撞,希望本篇能给出一个系统但依旧初步的答案。
简短版答案
AI4S 与 AIGC 将给整个人类社会的教学与科研体系带来巨大的变革;在这场变革中,知识的承载形式及交流分享方式、技术从底层算法创新到应用落地的过程,都将发生巨大的改变;进而,AIGC 将深刻影响社会生活的方方面面,而 AI4S 将推动科学研究与工业研发的持续革新、从而深刻改变世界;在此背景下,NBHub 希望以云上 Notebook 及进一步衍生出来的一系列文中被称为“代谢通路”的“发表体系”为载体,推动解决教学与科研体系革新过程中的瓶颈问题,进而推动形成一个鼓励开放的技术交流与分享、将拓展个人能力边界和人类认知边界融为一体的社区共同体。
NBHub 的口号是“让知识跑起来”。这里的“跑”既指知识以云上 Notebook 的形式一键运行、快速上手,又指知识在一个跨领域的开放共建的社区中充分、自由地传播与分享。
中长版答案
我们将通过以下四个部分进行讨论:
- AI4S 与 AIGC 时代,知识体系的更新迭代在加速、从底层创新到应用落地的过程在加速;
- 教学的新痛点、新需求、新实践——云上 Notebook 如何革新知识的传播、分享、与学习方式;
- 科研的新痛点、新需求、新实践——云上 Notebook 如何革新跨学科科研过程及广义的学术发表体系;
- 综合上述讨论,NBHub 希望做什么。
AI4S 与 AIGC 时代,知识体系的更新迭代在加速、从底层创新到应用落地的过程在加速
自工业革命以来,人类社会已经不再拥有所谓的“通才”。进入信息时代,信息爆炸伴随着知识爆炸,关于“学什么、怎么学、为什么学”等问题,任何具体的回答似乎都已不再能跟得上时代的节奏。进入AI时代,这一切又进一步需要被审视。如果说信息时代的“数字知识体系”尚属零散的网页索引和模拟器体系,那么AI时代的“知识体系”将在更大程度上被大模型融会贯通。
知识体系的更新和迭代正不断加速,而且,知识体系呈现出的是网状结构,而非被学科门类划分的树状结构。网状结构的演变有可能是连续的,但投影到树状结构却充满着相变。这将带来哪些变化呢?最突出的变化可能是对许多具体技能的需求迭代速度的显著提高。试想一下,还有哪些具体学科专业能够保持至少 5-10 年的就业优势呢?再想一下,我们可以说“ AI 可能是未来最需要学习的知识体系”,但关于“学什么、怎么学、谁来教”的问题,每年又在以多快的速度在发展和变化?
与此同时,从底层创新到应用落地的过程也在加速。上一代工业软件从最基础的计算机结合数值模拟的算法突破,到成为成熟解决方案与行业深度结合,用了 30 年;而从 Transformer 这样的最基础模型架构创新到 ChatGPT 这样的杀手级应用,仅用了5年。这种加速过程背后的原因是复杂多元的——这在本篇讨论的范畴之外。但是,这个过程越来越指向一个特征时间尺度的变化——从 20-30 年缩短到 3-5 年、甚至更短。
3-5 年意味着什么呢?它意味着一个学生从本科入学到毕业的时间、一个博士生从选择研究方向到毕业的时间;它意味着任何一个花足够长时间习得的具体技能体系本身都可能不再被需要;当然,它也意味着对更根本、更深层次的通识能力和人文关怀的需求。
这是我们当下所处时代的大背景。
我们与 ChatGPT 讨论了更多问题,感兴趣的读者可以点击链接查看:AI4S 与 AIGC 时代,云上 Notebook 将如何革新教学与科研体系NBHubhttps://nb.bohrium.dp.tech/detail/1320?utm_source=csdn
教学的新痛点、新需求、新实践——云上 Notebook 如何革新知识的传播、分享、与学习方式
教什么?学什么?谁在教?谁在学?啥时候教?啥时候学?在 AI4S 与 AIGC 时代,这些问题变成了灵魂问题。知识体系更新速度与教学体系适应和教学资源供应之间存在着难以调和的矛盾。传统的课本、教材和教学方法很难满足学生对最新知识的需求;教师也面临着如何在有限的时间内学新技术、以及向学生传授更多、更有效的知识的压力;甚至,对于大学和研究生教育来说,很大比例上充当主力的青年教师群体同时也面临着下一部分将讨论的科研压力,从而加剧了上述痛点痛的程度。
在这种背景下,自主学习、终身学习以及持续定义问题、解决问题的能力显得尤为重要。然而,这样的能力体系该如何系统地发展起来呢?我们发现,在跨学科碰撞与协作需求旺盛的当下,一个显著的缺失是能够快速上手、快速建立手感的“新技术入门体系”。
在信息爆炸与技术爆炸的时代,我们了解新技术进展的渠道和方式在快速变化。文献与技术 blog 的规模在扩大、平均质量在降低;技术博客或社交媒体的宣传更加简短、快速,但也难以深入。更关键的是,在很多跨领域的需求中,如何真正快速上手、尝试(例如花看一篇微信公众号的时间来探索 SAM 这样的图像预训练模型对材料图像表征需求的效果和进一步方案),并基于真正的“手感”来判断如何逐层深入,正在成为领域发展的瓶颈点。这已经催生了 Hugging Face Space 等实践,但更广泛的切入方式仍有待进一步探索,特别是考虑到 AI4S 的场景需求,知识结构往往更深、数据更少、软件/流程等历史包袱更重。
为了应对这些挑战,我们认为,满足个性化和灵活化学习需求的云上 Notebook 体系是最关键的切入点。在传统的教育模式中,云上 Notebook 作为一种基于云计算的在线编程环境,能够轻松实现知识的生产、传播和学习。在教学过程中,教师可以通过云上 Notebook 创建实时的教学示例和练习,学生则可以在线完成作业并获取即时反馈。此外,利用云上 Notebook,教师能够轻松地为学生提供最新的教学资源,使得知识的传播更加迅速。同时,学生可以根据自己的需求选择感兴趣的课程和项目,实现个性化学习。
云上 Notebook 还为教师和学生提供了一个共享的在线空间,方便双方进行实时交流和协作。更关键的是,在此基础上,“教师”与“学生”将不再是对立的、单向的关系,而是可以有非常多样化的组合——试想,当一个同学尝鲜、学习完一个新技术后,不只是写了一个技术 blog,而是写了一个优秀的云上 Notebook(我们将在后续文章中结合我们的实践来给出关于“优秀的云上 Notebook”的思考),然后马上所有人就可以连接云上机器进行实战式学习、优秀的案例也能无缝进入教学课堂,甚至大家可以相互评论、更新、改进、沉淀这个 Notebook。这样的模式岂不恰好是解决上述挑战问题的关键?
最后,为什么强调“云上”?核心原因是运维部署和弹性扩展等方面的能力需求是统一的、且具有规模效应的,很难以教学科研相对习惯的“小作坊”模式做起来。而恰恰是这些能力也让不同时间地点、不同形式组合、不同规模的灵活的、交互式的教与学成为可能。
科研的新痛点、新需求、新实践——云上 Notebook 如何革新跨学科科研过程及广义的学术发表体系
在 AI4S 和 AIGC 领域的快速发展背景下,科研体系在信息时代伊始就面临的挑战被进一步放大。以跨学科合作为例,不同领域的研究者在语言、方法和工具上的差异,使得跨学科合作在技术层面上变得非常困难。更雪上加霜的是,不同领域背景的人们所受到的激励也各不相同,这至少反映在他们所认可的学术期刊及相应的评审依据上,这使得大家即便关注同一问题,也容易因为关注的角度、希望项目推进的方式方向不同而难以取得有效进展。
那么,我们期待云上 Notebook 能做些什么呢?
我们需要从对广义的发表体系的讨论开始。实际上,学术论文体系、开源社区、微信公众号等,本身都可以被视为广义的发表体系。它们在载体与呈现形式、评审机制与评价体系、各方激励等方面均有所不同,因此适用于不同类型的情况。我们将不同的发表体系类比为不同类型的“代谢通路”,因为它们代表了不同类型的知识体系的吸收、分解、消化、合成、进化过程。
在当下这个 AI4S 和 AIGC 时代,我们发现:一方面,科研人员是在前沿创新和探索人类认知边界的一线群体;另一方面,本质上在承担推动科研体系运转核心作用的学术发表体系正在变得臃肿、笨重、僵化、从而反过来束缚了科研人员的生产力和创造力。在资源有限、学术群体规模持续增长的情况下,良性竞争正逐渐演变为“卷”的格局。越是“卷”,人们就越容易被现有指标绑架,越容易浪费时间或投机取巧,从而越难以产出有意义的工作。
对相关问题的讨论已经有很多,这里我们仅就呈现形式、评审与迭代机制来针对云上 Notebook 略作探讨。
就“呈现形式”而言,学术文章的呈现形式是文字、图表等;开源软件的呈现形式基本上是代码和文档;而云上 Notebook 的呈现形式则综合两者,本身能很方便地搭载文档和代码,且在良好的后端支持下,还可以有模型/数据/算力稳定可扩展的系统环境,并保障学术成果或技术探索的可重复性。当下正在有越来越多的学术期刊探索 Notebook 的形式。例如,2022 年末,流体力学顶刊 Journal of Fluid Mechanics (JFM) 发布了其 Notebook 系列。我们直接引用其发刊词《Introducing JFM Notebooks》的首段作为对这里讨论的补充:
Source: J. Fluid Mech. (2022), vol. 952, E1, doi:10.1017/jfm.2022.903
就评审与迭代机制而言,学术论文体系依赖的是“同行评审”。当下面临两个问题:
- 在跨学科语境下“同行”是否容易被定义和归类;
- “卷”的局面及文章和期刊日益泛滥的情况下“同行”是否有足够多的时间来做高质量、负责任的评审。而从对知识体系的迭代推动方式来看,对学术论文来说,新的进展往往意味着需要通过新的一篇文章来呈现。也是因此,越来越多的文章的越来越大比例的部分正在成为八股文——这会成为大语言模型更擅长的事情。
相比较而言,开源社区的“评审”是分布式、用脚投票的——一个东西解决问题就有人用、有人用且有问题就会持续反馈与解决,于是用户的规模和一系列反馈便起到了评审的作用。开源体系的迭代,无论是开源代码,还是开源的数据、模型,乃至像 wikipedia 这样的开源文档体系,都有较为成熟的 CI(continuous integration 持续集成)机制来更新迭代。云上 Notebook 作为一种新的呈现形式,评审与迭代机制可以较为灵活,可以参考学术论文、也可以参考技术 blog 或者 wikipedia,但其核心在于带着 code block 以及包含数据模型算力的云上环境。
对很多创新成果来说,开源+云上 Notebook 可能是一种比发表文章反馈迭代快且广泛很多的形式。我们相信,会有越来越多的 Paper with Notebook、甚至 Paper as Notebook 的实践出现,这也更能顺应“知识体系更新迭代加速、从底层创新到应用落地过程加速”的大背景。
值得注意的是,对云上 Notebook 的支持不意味着对现有发表体系的“替代”,而意味着为创新成果找到新的“出口”、新的“代谢通路”。我们也在积极探索各种类型的“代谢通路”,例如发起 DeepModeling 开源社区并逐渐体系化,也例如结合 MLOPS 技术的算法解决方案快速上线也在新一轮的尝试中(一个参考是结合 Uni-Mol 技术的 Bohrium APP Uni-QSAR)。这些尝试正在很大程度地解放生产力和创造力。我们会发现,对于大量真正有意义的算法来说,快速解决问题、得到反馈比使劲憋文章、跟审稿人干架来得更关键——当这里的“大量”真的“量够大”时,革新也自然就会发生。此外,这些本质上在提升创新效能的手段也能最大程度地减缓与“卷”的逻辑的矛盾。
同样值得注意的是,无论是这里的 Notebook、还是 APP,与纯粹的开源代码或 Wiki 体系很大的区别在于对后端环境的需求。算力/数据/软件等系统环境是任何类型的计算解决方案所必须的,在这些方面哪怕开发成本是固定的,更大的成本——且是边际成本——也会发生在规模化使用和持续迭代维护上。对于任何一个 AI 模型体系也同样如此。因此,我们需要一个运行足够良好的经济模型和协同体系来支撑这个体系的运转,这是需要根据实际情况寻求最佳方案的、也是需要持续探索的。
综合上述讨论,NBHub 希望做什么
NBHub 希望推动形成一个在 AI4S 与 AIGC 时代让知识“跑”起来的社区。这里的“跑”既指以云上 Notebook 的形式一键运行、快速上手,又指在一个跨领域的开放共建的社区中充分、自由地传播与分享。这种灵活的社区形式将作为教学与科研体系的有效补充,并终将推动现有教学与科研体系的革新。
NBHub 目前主要通过微信公众号的形式运营,我们也将探索更为丰富的形式。我们希望 NBHub 的内容覆盖 AI4S 与 AIGC 领域那些适合不只“看”、还得“跑”的知识,包括经典的技术体系、也包括前沿的技术进展,以及好玩、有用的新鲜内容,和对先进实践的推广介绍,等等。对于那些痛点鲜明、共振强烈的群体(例如我们最近发现的 AI for Bioinformatics 群体)我们将进一步通过灵活的社区教学交流等形式的活动组织起来。对于任何对 NBHub 的想法、建议,都欢迎提出;也欢迎以任何形式加入我们。
令人惊喜的是,在我们推出一系列优质 Notebook 内容的同时,其集散地—— Notebook 案例广场,正在被越来越多地关注起来。有一天,我们发现有一位朋友在他的朋友圈热情地推荐案例广场。当我们问他是什么激起他的分享欲时,他说:“……我顺着这个 Uni-mol 相关的教程摸到了整个案例广场,发现里面已经有很多高质量的 Notebook 了;想起以前学东西的时候都是全网搜(可能尤其在 CSDN 上),然后质量和版本都参差不齐,在学习之前还得先解决很多的配置问题,不同版本的指令可能还不太一样;然后惊奇地案例广场上的 Notebook 的数量和覆盖面已经很广了,还有包括像 Python 作图类的教程,Notebook 有审核、能跑通;我觉得这对新手或者想了解这个领域的人是很激动的,甚至可能很少会有人的知识面是覆盖案例广场上所有案例的;所以从这个角度上我觉得是个“宝藏库”,一定程度上,新手入门最高效的方式之一是在有标准答案或者指导的情况下“做作业”,这个层面上,案例广场降低了我获取知识的成本,提高了学习效率”。对此我们感到激动——这正是我们希望推动做好的。
文章来源:https://www.toymoban.com/news/detail-560270.html
最后,One More Thing。通过 NBHub,我们最希望倡导的,还是回归好奇心与责任心驱动下最朴素的价值追求。技术在飞快地发展,但“科技向善”永不过时。如 DeepModeling 社区宣言所言,“那些希望通过计算建模突破科学边界、解决困难问题的人们正在以前所未有的新方式集结起来。他们需要新的基础设施——新的协作平台,新的代码框架,新的数据处理手段,新的算力使用方式;他们需要新的文化——追求通力协作、惠及大众;追求知识与工具的自由交流与分享;追求尊重并欣赏相互的成就、和而不同。”我们希望推动的,是让那些志同道合者,能在这里,成为更好的自己。文章来源地址https://www.toymoban.com/news/detail-560270.html
到了这里,关于AI4S 与 AIGC 时代,云上 Notebook 将如何革新教学与科研体系的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!