【前沿技术杂谈:迁移学习】迁移学习是在航空业实现人工智能的最后一步吗?

这篇具有很好参考价值的文章主要介绍了【前沿技术杂谈:迁移学习】迁移学习是在航空业实现人工智能的最后一步吗?。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

机器学习模仿人类如何通过经验获取知识。然而,人类也可以在不同的任务之间转移知识。假设您知道如何弹吉他——学习如何弹奏班卓琴对您来说有多难?钢琴呢——你需要多少进一步的学习?

这种建立在以前经验之上的理论,而不是从头开始学习,是当今机器学习的一个热门话题。这种方法称为迁移学习。 正如Andrew NG在NIPS 2019教程中评论的那样:“在监督学习之后 - 迁移学习将成为ML商业成功的下一个驱动力”

What is “transfer learning”? 什么是“迁移学习”?

迁移学习是一个令人兴奋的概念,它旨在重新发展机器学习模型需要从头开始重建的传统观念,即使新的案例研究只是一个特征(领域变量)分布变化。通过迁移学习,您不必一次又一次地训练模型,而是可以使用为一项任务获得的知识来解决相关任务。

数据科学中迁移学习背后的关键概念是深度学习模型。它们需要大量数据,如果你的模型也是受监督的,这意味着你需要大量的标记数据。参与机器学习项目的每个人都知道,标记数据样本非常繁琐且耗时。由于缺乏标记的训练数据,此过程会减慢您的模型开发团队的速度,甚至会阻止成功的机会。深度学习解决方案的另一个常见问题是,尽管最先进的算法具有很高的准确性,但它们依赖于非常具体的数据集,并且在实际操作场景中引入新的模式和案例时会遭受巨大的性能损失

迁移学习并不是一个新概念,实际上可以追溯到NIPS 1995研讨会“学习学习:归纳系统中的知识巩固和转移”。除了用于改进深度学习模型外,迁移学习还用于构建和训练机器学习模型的新方法。

【前沿技术杂谈:迁移学习】迁移学习是在航空业实现人工智能的最后一步吗?,深度学习知识专栏,人工智能,迁移学习,机器学习

传统机器学习与迁移学习

航空业迁移学习的一个真实例子:预测跑道占用率

【前沿技术杂谈:迁移学习】迁移学习是在航空业实现人工智能的最后一步吗?,深度学习知识专栏,人工智能,迁移学习,机器学习
举例来说,我们在一个名为 Safeclouds.eu 的 H2020 项目中开发了一个机器学习模型。该模型试图准确预测距离跑道阈值 2NM 处的到达跑道占用时间 (AROT)

  1. 我们得到了一个庞大的数据集,该数据集由已知的 AROTs 标示,其中包含在特定机场(维也纳机场,LOWW)的特定跑道(R34)上的运行情况。数据集由不同的数据源(雷达轨迹、飞行计划、天气信息等)组成。
  2. 我们利用这些数据训练了一个机器学习模型。该模型对属于该领域的未见数据点(即 LOWW 机场的 R34)进行了很好的泛化。我们将这项预测任务称为 T1
  3. 假设我们想将训练好的模型应用到另一个机场的另一条跑道上,例如巴塞罗那机场(LEBL)的 25R 跑道。让我们把这项新任务称为新领域中的 T2
  4. 从理论上讲,我们应该能够将经过训练的模型应用于 T1,但新的预测会观察到巨大的性能下降。这是机器学习中一个众所周知的问题:当域发生变化时,我们会向模型引入偏差。
  5. 在这种情况下,我们也会注意到 T2 的数据比 T1 的数据少得多。在训练另一个模型时,我们没有足够的样本来在预测方面表现出色。
  6. 因此,只剩下一种解决方案:应用迁移学习,使用 T2 可用的新数据“重新训练”我们的 T1 模型。

通过遵循这种方法,我们可以将我们的预测模型推广到全球每个机场!

迁移学习的挑战以及如何应对这些挑战

事实上,将预训练模型用于新任务/领域的想法并不那么容易应用。例如,如果两个域不同,它们可能具有不同的特征空间或不同的边缘分布。这意味着描述您的新研究案例的变量可能不同。

此外,当两个任务不同时,它们可能会呈现不同的标签空间或不同的条件分布。这可能意味着可能会出现新的、未见过的情况,并且您的模型可能会专注于检测不平衡的情况(例如很少发生的新情况)。

为了事先解决这些问题,我们需要回答一些问题:

  1. 我们需要迁移什么?:我们需要确定模型知识的哪些方面与新案例研究相关。通常,这涉及评估源和目标的共同点。功能相同吗?目标变量是否处于相似分布?有新课程吗?
  2. 什么时候迁移是安全的? 在某些情况下,迁移学习不仅不可行,反而会使模型变得更糟(称为负迁移)。我们需要仔细评估这两种情况,并与这两种情况下的领域专家反复确认。
  3. 我们应该如何转移? 一旦我们确定了需要转移的内容以及它是否可行,我们就必须确定跨领域/跨任务转移知识的正确方法。了解哪些现有算法和技术适用是非常重要的。别担心,我们将在下一篇文章中介绍一些迁移学习算法。

结论和未来的帖子

迁移学习是迄今为止最有前途的机器学习主流产品推动者。该行业可能需要采用它,以便提供可以快速原型化的可靠解决方案。我个人认为这将成为未来某个关键的方法论。例如,近年来,用于计算机视觉或语音识别的预训练模型库已经出现(Google BERT、PyTorch 的 torchvision、Tensorflow 模型、fastAI 等)。

在以后的文章中,我们将介绍现有的迁移学习方法和算法,以及来自知名机器学习参与者的一些迁移学习的成功用例。敬请关注!文章来源地址https://www.toymoban.com/news/detail-820770.html

到了这里,关于【前沿技术杂谈:迁移学习】迁移学习是在航空业实现人工智能的最后一步吗?的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 人工智能前沿研究综述:对比学习、迁移学习、知识蒸馏的探索与未来展望

    导言         随着人工智能领域的不断发展,对比学习、迁移学习和知识蒸馏等研究方向成为热门话题。本文将全面探讨这些前沿研究的发展、面临的问题、解决过程,以及未来可能的研究趋势。 1. 对比学习的发展与挑战               1.1 发展历程         演

    2024年01月22日
    浏览(52)
  • 百度Apollo学习心得:探索自动驾驶技术的前沿之旅

    百度Apollo是一项引领自动驾驶技术发展的开放平台,通过深度学习、感知与决策、定位与控制等关键技术,为开发者提供了丰富的工具和资源。在学习百度Apollo的过程中,我深刻认识到自动驾驶技术的重要性和挑战,并积累了宝贵的学习心得。本文将分享我的学习心得,希望

    2024年02月11日
    浏览(38)
  • 前端前沿web 3d可视化技术 ThreeJS学习全记录

    完整案例与项目代码: gitee开源项目地址 https://gitee.com/jumping-world-line/01_threeJS_basic 随着浏览器性能和网络带宽的提升 使得3D技术不再是桌面的专利 打破传统平面展示模式 前端方向主要流向的3D图形库包括Three.js和WebGL WebGL灵活高性能,但代码量大,难度大,需要掌握很多底层

    2024年02月01日
    浏览(58)
  • 低代码技术杂谈

    “Low-Code”是什么?身为技术人员听到这种技术名词,咱们第一反应就是翻看维基百科 或者其他相关技术论文,咱们想看维基百科的英文介绍: A low-code development platform (LCDP) provides a development environment used to create application software through a graphical user interface inste

    2024年01月23日
    浏览(36)
  • 自动驾驶TPM技术杂谈 ———— 车辆分类

    机动车规格分类 分类 说明 汽车 载客汽车 大型 车长大于或等于 6000mm 或者乘坐人数大于或等于20 人的载客汽车。 中型 车长小于 6000mm 且乘坐人数为10~19 人的载客汽车。 小型 车长小于 6000mm 且乘坐人数小于或等于9 人的载客汽车,但不包括微型载客汽车。 微型 车长小于或等

    2024年02月09日
    浏览(40)
  • 云计算-存算一体-EDA-技术杂谈

    云计算-存算一体-EDA-技术杂谈 参考文献链接 https://mp.weixin.qq.com/s/2-MAT6xI2fcXT4LOO00gSQ https://mp.weixin.qq.com/s/bryK0IfNciB-UdigtUOfnA https://mp.weixin.qq.com/s/Snlh8rJByc9vvqEvnIad2g https://mp.weixin.qq.com/s/CeiWJ_SbzxUIFo4phZ7HGw 云原生背景下的云计算 ■ 多维云资源产品化,促动传统应用软件向云原生系统

    2024年02月08日
    浏览(43)
  • [技术杂谈]几款常用的安装包制作工具

    下面是几款常用的安装包制作工具: Inno Setup:Inno Setup 是一款免费开源的 Windows 平台上的安装包制作工具,支持多种自定义选项和脚本编写,提供了可视化的界面和易于使用的向导引导。它可以创建用户友好的安装程序,包括文件复制、注册表修改、快捷方式添加等功能。

    2024年02月09日
    浏览(43)
  • 区块链的潜力是在物联网网络中实现,还是被保留为利基技术

    区块链与物联网的融合成功解决了智能互联系统中的诸多问题。尽管不同领域的组织都在拥抱区块链,但他们也将在未来几年意识到该技术的真正潜力,它不会再“只是”成为一种小众技术。 物联网或物联网通过连接人、设备、地点和技术来发挥作用,为个人和组织创造价值

    2024年04月09日
    浏览(44)
  • [技术杂谈][chatgpt]chatgpt相关开源代码地址汇总

    1、有预训练模型且可以训练自己的数据集: OpenChatKit: GitHub - togethercomputer/OpenChatKit Contribute to togethercomputer/OpenChatKit development by creating an account on GitHub. https://github.com/togethercomputer/OpenChatKit dolly: GitHub - databrickslabs/dolly: Databricks’ Dolly, a large language model trained on the Databricks Mac

    2023年04月24日
    浏览(47)
  • 2023MathorCup建模D题思路 - 航空安全风险分析和飞行技术评估问题

    D题 航空安全风险分析和飞行技术评估问题 飞行安全是民航运输业赖以生存和发展的基础。随着我国民航业的快速发展,针对飞行安全问题的研究显得越来越重要。2022 年 3 月 21 日,“3.21”空难的发生终结了中国民航安全飞行 1 亿零 59 万飞行小时的历史最好安全记录。严重

    2024年02月07日
    浏览(37)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包