人工智能的 10 个重大数理基础问题

这篇具有很好参考价值的文章主要介绍了人工智能的 10 个重大数理基础问题。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

        本篇文章是博主在人工智能等领域学习时,用于个人学习、研究或者欣赏使用,并基于博主对人工智能等领域的一些理解而记录的学习摘录和笔记。若有不当和侵权之处,指出后将会立即改正,还望谅解。

文章分类在学习摘录和笔记专栏

        学习摘录和笔记(1)---人工智能的 10 个重大数理基础问题》

人工智能的 10 个重大数理基础问题

原文/论文出处:

题目:《人工智能的 10 个重大数理基础问题》

作者:徐宗本 

时间:收稿日期: 2021–07–04; 接受日期: 2021–09–30; 网络出版日期: 2021–12–09

来源:中国科学 : 信息科学

1.大数据的统计学基础;

        当下人工智能的主流技术 (如深度学习) 是以对大数据的加工处理为基础的,它的模型、分析、计算基础都根置于统计学。统计学一直被认为是主导和引导人们分析和利用数据的学科。所有建模都必须在表示的广泛性和统计推断的易实现性或可解释性之间取得平衡,这是所有方法的瓶颈。


2.大数据计算的基础算法;

        大数据分析处理的核心是通过计算对大数据进行加工处理和从中萃取有用信息。人工智能应用的主要障碍之一是,对真正的大数据,大部分已知的核心算法和基础算法失效 (要么不能用,要么算不出满意结果),例如,还没有一个好的算法能对超过 TB 级的数据进行直接聚类。

        缺乏这样的大数据算法之根本原因在于传统计算理论,以及基于传统计算理论的算法设计与分析方法学在大数据环境下失效。美国国家科学院/全国研究理事会在其发表的报告中,将在大数据环境下求解如下7 个数学问题的问题称为 “7 个巨人问题”

        • 基本统计 (basic statistics);

        • 广义 N- 体问题 (generalized N-body problem);

        • 图计算问题 (graph-theoretic computation);

        • 线代数计算 (linear algebraic computation);

        • 最优化 (optimization);

        • 积分 (integration);

        • 比对问题 (alignment problem)。


3.数据空间的结构与特性;

        我们所处的世界由人类社会物理空间 (这二者常统称为现实世界) 和信息空间 (称为虚拟世界)构成。人类社会的构成元素是,物理空间的构成元素是原子/分子,而信息空间的构成元素是数据

人工智能作用:在数据空间是利用数据空间的方法认知和操控现实世界的技术。

        对常见的这些数据空间,能不能赋予某种数学结构使它们成为数学上的空间呢?

        如能,它们又会成为什么样的数学空间?

        是内积空间、赋范空间,还是拓扑空间 (请注意,不同的数学空间提供的分析工具是有差别的)?

        应该赋予什么样的数学结构才最自然、最合理、最有利于数据分析? 让我们仍以图像空间为例说得更具体一些: 我们能不能通过赋以缩放、卷积、平移 + 旋转等操作或运算,并选取图像差异性的一种度量,如欧氏距离、KL 散度、Wasserstein 距离等,使图像空间成为数学意义下的空间?

        如能,怎样的选择和搭配才能使所建立起来的空间更有利于图像分析?


4.深度学习的数学机理; 

        当代人工智能的主流技术是以深度学习为代表的。 深度学习的巨大成功极大提升了它作为普适AI 技术的主导地位,但另一方面,也唤起人们对深度学习本质局限性和 “后深度学习时代” 的思考。 

        深度学习的独特优势是,对任意复杂数据都有强的建模能力,只要训练数据足够,就一定可学习、可应用,从而能提供普适的 AI 解决方案。 

        但它的致命缺陷是,网络结构难设计、结果不具可解释性、易受欺骗等。


5.非正规约束下的最优输运; 

        人工智能中的诸多问题都是以数据输运 (data transportation) 或者说数据打通为基础的。 例如,机器翻译需要把两种语言打通、把语音与文字打通,机器视觉需要把图像与文字打通。
        如何能够实现 “保不变量” 意义下的最优传输? 所有这些是数据转换、打通的基础,也是迁移学习的最根本问题。


6.如何学习学习方法论; 

        学习方法论是指导、管理学习者如何学习/完成学习任务的一般原则与方法学。 

        在人工智能从人工化,走向自动化,迈向自主化的大趋势下,让机器学会人类的学习方法论,或者更严格地说,学会模拟学习方法论 (simulate learning methodology,SLM) 成为 AI 发展的必由之路。

        函数空间的学习理论是一个尚未得到开垦的领域。


7.如何突破机器学习的先验假设;

机器学习的应用与有效性一直是以一些基本的先验假设为前提的,例如:

        (i) 大容量假设:我们总是假设空间 F 的容量是充分大的,它既能包含 但又不依赖于去构造; 

        (ii) 独立性假设: 最优性准则是独立于数据生成机制设置的,特别是,损失度量独立于数据而预设等。

        所有这些假设是机器学习研究的常规性设置。 这既可以认为是机器学习能得以飞速发展的原由,也是机器学习发展的桎梏。 要提高现有人工智能技术的应用水平与性能,就必须要突破这些机器学习先验假设。


8.机器学习的自动化; 

        这一新的浪潮应是 “适应环境” 的浪潮,是在克服现有深度学习只适用封闭静态环境、固定任务、鲁棒性不好、解释性不强等缺陷基础上,着力发展对开放动态环境可用、稳健、可解释的、自适应的 AI 技术。一个更为现实而且也是必须实现的中间阶段目标是实现机器学习的自动化“6 个自” 的目标:

        • 数据/样本层面: 数据自生成、数据自选择;

        • 模型/算法层面: 模型自构建、算法自设计;

        • 任务/环境层面: 任务自切换、环境自适应。


9.知识推理与数据学习的融合;

        后深度学习时代必然追求把知识推理与深度学习能够结合起来,以使得深度学习在保持强大的数据学习能力基础上,具有更明确的可解释性和更强的泛化性。在数据空间语义空间之间建立一个中间空间来联通数据与知识应该是一个很好的选择

        理论上分析数据 – 知识混合系统也是一个挑战性问题。


10.智能寻优与人工智能芯片问题。

        数学的最优化理论与方法提供了寻优的理论基础,但数学方法通常假定目标函数的解析形式、具有凸结构和超参数已知。 解决寻优问题也并不是深度学习的特长。 所以,如何设计寻优的人工智能过程仍远未解决。

        人工智能芯片是加速 AI 算法执行的利器,其功能是将 AI 算法中特定重复使用的运算/操作硬件化 (以片上集成电路的方式),本质是以物理的方式实现数学运算或操作。基于某些更高层次的优化算法 (例如 ADMM) 芯片来加速人工智能算法是值得探讨的方向。


11.其他:

 人工智能技术和发展主要是靠 “算例、算法、算力” 所驱动的,其基础是数据,其核心是算法,

 数学不仅仅是工具,还是技术内涵本身,而且常常也是最能体现本质、原始创新的部分。

人工智能算法本质上是:

        大数据分析处理算法,主要解决大数据分析与处理技术底层依赖的相关数学模型、分析原理与计算方法等问题。

人工智能作用:

        在数据空间是利用数据空间的方法认知和操控现实世界的技术

结构化的本质

        寻求数据的数学表示

        当一个对象集合被赋予某种数学结构 (运算 + 拓扑) 后可成为数学意义下的空间

深度学习的独特优势是:

        对任意复杂数据都有强的建模能力,只要训练数据足够,就一定可学习、可应用,从而能提供普适的 AI 解决方案。 

致命缺陷是:网络结构难设计、结果不具可解释性、易受欺骗等。

网络拓扑(Network Topology)结构

        是指用传输介质互连各种设备的物理布局。指构成网络的成员间特定的物理的即真实的、或者逻辑的即虚拟的排列方式。如果两个网络的连接结构相同我们就说它们的网络拓扑相同,尽管它们各自内部的物理接线、节点间距离可能会有不同。

        在实际生活中,计算机与网络设备要实现互联,就必须使用一定的组织结构进行连接,这种组织结构就叫做“拓扑结构”。

        网络拓扑结构形象地描述了网络的安排和配置方式,以及各节点之间的相互关系,通俗地说,“拓扑结构”就是指这些计算机与通讯设备是如何连接在一起的。

欧几里得空间(Euclidean space)

        是指一类特殊的向量空间,对通常3维空间V3中的向量可以讨论长度、夹角等几何性质。

     文章若有不当和不正确之处,还望理解与指出。由于部分文字、图片等来源于互联网,无法核实真实出处,如涉及相关争议,请联系博主删除。如有错误、疑问和侵权,欢迎评论留言联系作者,或者关注VX公众号:Rain21321,联系作者。文章来源地址https://www.toymoban.com/news/detail-540617.html

到了这里,关于人工智能的 10 个重大数理基础问题的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 人工智能基础学习

    人类的一大优势是没有一种智能。 有些人可以轻松学习新语言,而另一些人则精通科学和技术。 然而,许多伟大的艺术家都是糟糕的数学家。 另一方面,许多伟大的数学家都是糟糕的艺术家。 但每个人都可以以自己的方式变得聪明。 人类智能没有一个标准。 这使得你很难

    2024年02月12日
    浏览(22)
  • 学习人工智能-基础篇

    背景 随着大模型的火爆,人工智能再次被推到高潮,其实它在众多行业领域已经落地很多应用,并给社会带来了巨大的经济价值。其中包括互联网、教育、金融、医疗、交通、物流等等。在测试领域也有一些落地的案例,作为测试人员,有必要去了解并学习人工智能,去挖掘

    2024年02月04日
    浏览(17)
  • 如何零基础学习“人工智能”?

    人工智能(AI)是近年来快速发展的领域之一,它已经开始改变我们的生活和工作方式。 人工智能(AI)是一项旨在使计算机系统能够执行以前需要人类智力才能完成的任务的技术。AI可以用来解决许多问题,包括语音识别、图像处理、自然语言处理和机器翻译等。它已经开始

    2024年02月07日
    浏览(19)
  • 人工智能技术基础系列之:机器学习基础

    作者:禅与计算机程序设计艺术 在互联网的飞速发展和计算机的高计算性能的驱动下,人工智能迎来了新的时代。机器学习作为人工智能领域的一个重要分支,是实现这一目标的一种方法。本文将从机器学习的基本概念出发,介绍机器学习的一些基本术语、概率论基础、算法

    2024年02月07日
    浏览(20)
  • 人工智能学习07--pytorch15(前接pytorch10)--目标检测:FPN结构详解

    backbone:骨干网络,例如cnn的一系列。(特征提取) (a)特征图像金字塔 检测不同尺寸目标。 首先将图片缩放到不同尺度,针对每个尺度图片都一次通过算法进行预测。 但是这样一来,生成多少个尺度就要预测多少次,训练效率很低。 (b)单一特征图 faster rcnn所采用的一种方式

    2023年04月12日
    浏览(21)
  • 【人工智能】监督学习、分类问题、决策树、信息增益

    什么是决策树 —— 基本概念 非叶节点:一个属性上的测试,每个分枝代表该测试的输出 叶节点:存放一个类标记 规则:从根节点到叶节点的一条属性取值路径 模型训练:从已有数据中生成一棵决策树 分裂数据的特征,寻找决策类别的路径 相同的数据,根据不同的特征顺

    2024年02月16日
    浏览(23)
  • 【AI人工智能学习】GitHub 上适合初学者的 10 个最佳开源 AI 项目

      温馨提示:AI一定是未来程序员的出路,大家可以早点入坑。 目录 人工智能简介 GitHub 上适合初学者的 10 个最佳开源 AI 项目 Part.1 TensorFlow Part.2 PyTorch Part.3 Keras

    2024年02月04日
    浏览(42)
  • 真假阳性问题:可解释性机器学习与人工智能

    在过去的几年里,人工智能(AI)和机器学习(ML)技术已经取得了显著的进展,这些技术在各个领域得到了广泛的应用。然而,随着这些技术的发展,一个重要的问题也逐渐凸显:真假阳性问题。真假阳性问题是指在预测或分类任务中,模型预测为正例(阳性)的样本实际上是否确实

    2024年04月28日
    浏览(15)
  • 人工智能基础_机器学习006_有监督机器学习_正规方程的公式推导_最小二乘法_凸函数的判定---人工智能工作笔记0046

    我们来看一下公式的推导这部分比较难一些, 首先要记住公式,这个公式,不用自己理解,知道怎么用就行, 比如这个(mA)T 这个转置的关系要知道 然后我们看这个符号就是求X的导数,X导数的转置除以X的导数,就得到单位矩阵, 可以看到下面也是,各种X的导数,然后计算,得到对应的矩阵

    2024年02月08日
    浏览(22)
  • 人工智能基础_机器学习007_高斯分布_概率计算_最小二乘法推导_得出损失函数---人工智能工作笔记0047

    这个不分也是挺难的,但是之前有详细的,解释了,之前的文章中有, 那么这里会简单提一下,然后,继续向下学习 首先我们要知道高斯分布,也就是,正太分布, 这个可以预测x在多少的时候,概率最大 要知道在概率分布这个,高斯分布公式中,u代表平均值,然后西格玛代表标准差,知道了

    2024年02月07日
    浏览(30)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包