【数学】通俗理解泰勒公式(牛顿迭代法有用到)

这篇具有很好参考价值的文章主要介绍了【数学】通俗理解泰勒公式(牛顿迭代法有用到)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

【数学】通俗理解泰勒公式(牛顿迭代法有用到)

1. 介绍

最近在看一些机器学习优化相关的方法(梯度下降、牛顿迭代等),里面又涉及到泰勒公式展开等,大学学的奈何都忘的差不多了,于是就看了一些博客,整理一下。

泰勒公式,也称泰勒展开式。是用一个函数在某点的信息,描述其附近取值的公式。如果函数足够平滑,在已知函数在某一点的各阶导数值的情况下,泰勒公式可以利用这些导数值来做系数,构建一个多项式近似函数,求得在这一点的邻域中的值。

  • 所以泰勒公式是做什么用的?
    • 简单来讲就是用一个多项式函数去逼近一个给定的函数(即尽量使多项式函数图像拟合给定的函数图像),注意,逼近的时候一定是从函数图像上的某个点展开。
    • 如果一个非常复杂函数,想求其某个值,直接求无法实现,这时候可以使用泰勒公式去近似的求该值,这是泰勒公式的应用之一。
    • 泰勒公式在机器学习中主要应用于梯度迭代(牛顿迭代法)。

2. 通俗理解

下式是最简单的一类初等函数,也就是多项式。
【数学】通俗理解泰勒公式(牛顿迭代法有用到)

  • 多项式本身的运算仅是有限项加减法和乘法,所以在数值计算方面,多项式是人们乐于使用的工具。因此我们经常用多项式来近似表达函数。这也是为什么泰勒公式选择多项式函数去近似表达给定的函数。

2.1 近似计算

初等数学已经了解到一些函数如:
【数学】通俗理解泰勒公式(牛顿迭代法有用到)
但是初等数学不曾回答怎样来计算它们,以 f ( x ) = cos ⁡ x f(x) = \small \cos x f(x)=cosx 的近似计算为例,这里进行计算:

1)一次(线性)逼近

利用微分近似计算公式 f ( x ) ≈ f ( x 0 ) + f ′ ( x 0 ) ( x − x 0 ) f(x) \small \approx f(\small x_{0}) + {f}'(\small x_{0})(x - \small x_{0}) f(x)f(x0)+f(x0)(xx0) (该式由导数/微分的极限表达公式转换得到),对 x 0 = 0 \small x_{0} = 0 x0=0 附近的 f ( x ) f(x) f(x) 的线性逼近为: f ( x ) ≈ f ( 0 ) + f ′ ( 0 ) x f(x) \small \approx f(0) + {f}'(0) x f(x)f(0)+f(0)x , 所以 f ( x ) = cos ⁡ x ≈ 1 f(x) = \small \cos x \small \approx 1 f(x)=cosx1,所以 f ( x ) f(x) f(x) x 0 = 0 \small x_{0} = 0 x0=0 附近的线性逼近函数 P 1 ( x ) = 1 P_{1}(x) = 1 P1(x)=1,如下图:
【数学】通俗理解泰勒公式(牛顿迭代法有用到)

  • 线性逼近-优点:形式简单,计算方便;
  • 线性逼近-缺点:离原点O越远,近似度越差。

2)二次逼近

使用二次多项式 p 2 ( x ) = a 0 + a 1 x + a 2 x 2 p_2(x) = a_0 + a_1x + a_2 x^2 p2(x)=a0+a1x+a2x2 来逼近 f ( x ) = cos ⁡ x f(x) = \small \cos x f(x)=cosx,我们期望:

【数学】通俗理解泰勒公式(牛顿迭代法有用到)
所以 cos ⁡ x ≈ P 2 ( x ) = 1 − x 2 2 \small \cos x \small \approx \small P_{2}\left ( x \right ) = 1 - \small \frac{x^{2}}{2} cosxP2(x)=12x2,如下图:

【数学】通俗理解泰勒公式(牛顿迭代法有用到)

  • 二次逼近要比线性逼近好得多,但局限于 [ − π 2 , π 2 ] [ \small -\frac{\pi }{2},\small \frac{\pi }{2} ] [2π2π] 内,在这个范围之外,图像明显差异很大。
  • 为什么我们期望两个函数在某一点的函数值 、一阶导数值、二阶导数值相等?
    • 因为这些值表达了函数(图像)最基本和最主要的性质,这些性质逼近即可以使得两个函数逼近(由上面函数图像可以直观地看出来)。这也是泰勒公式的基本思想。

3)八次逼近

使用八次多项式 p 8 ( x ) = a 0 + a 1 x + a 2 x 2 + . . . + a 8 x 8 p_8(x) = a_0 + a_1x + a_2 x^2 + ... + a_8 x^8 p8(x)=a0+a1x+a2x2+...+a8x8 来逼近 f ( x ) = cos ⁡ x f(x) = \small \cos x f(x)=cosx,我们期望:
【数学】通俗理解泰勒公式(牛顿迭代法有用到)
因此,可以得到:
【数学】通俗理解泰勒公式(牛顿迭代法有用到)

  • 图像如下图:
    【数学】通俗理解泰勒公式(牛顿迭代法有用到)

  • P 8 ( x ) \small P_{8}\left ( x \right ) P8(x) (绿色图像) 比 P 2 ( x ) \small P_{2}\left ( x \right ) P2(x) (蓝色图像) 更大范围内更接近余弦函数 (红色图像)

综上,由上述3次不同程度的函数逼近可以看出:对于精确度要求较高且需要估计误差的时候,必须用高次多项式来近似表达函数,同时给出误差公式 。以上就是利用多项式函数去逼近给定函数的一个过程。

3. 泰勒公式的推导

由此引出一个问题:给定一个函数 f ( x ) \small f\left ( x \right ) f(x),要找一个在指定点 x 0 \small x_{0} x0 附近与 f ( x ) \small f\left ( x \right ) f(x) 很近似的多项式函数 P ( x ) \small P\left ( x \right ) P(x),记为:
【数学】通俗理解泰勒公式(牛顿迭代法有用到)
使得 f ( x ) ≈ P n ( x ) \small f\left ( x \right ) \small \approx \small P_{n}\left ( x \right ) f(x)Pn(x) 并且使得两者误差 R n ( x ) = f ( x ) − P n ( x ) \small R_{n}\left ( x \right ) = f\left ( x \right ) - P_{n}\left ( x \right ) Rn(x)=f(x)Pn(x) 可估计。所以要找的多项式应该满足什么条件,误差是什么?

  • 从几何上看, y = f ( x ) \small y = f\left ( x \right ) y=f(x) y = P n ( x ) \small y = P_{n}\left ( x \right ) y=Pn(x) 代表两条曲线,如下图:

【数学】通俗理解泰勒公式(牛顿迭代法有用到)
使它们在 x 0 \small x_{0} x0 的附近很靠近,很明显:

  1. 首先要求两曲线在 ( x 0 , f ( x 0 ) ) \small \left ( x_{0},f\left ( x_{0} \right ) \right ) (x0,f(x0)) 点相交,即 P n ( x 0 ) = f ( x 0 ) \small P_{n}\left ( x_{0} \right ) = f\left ( x_{0} \right ) Pn(x0)=f(x0)

  2. 如果要靠得更近,还要求两曲线在 ( x 0 , f ( x 0 ) ) \small \left ( x_{0},f\left ( x_{0} \right ) \right ) (x0,f(x0)) 点相切,(由图像可以直观看出,相交 [ 棕色和红色图像 ] 和 相切 [ 绿色和红色图像 ],两曲线在 x 0 \small x_{0} x0 附近的靠近情况明显差异很大,相切更接近),即 P n ′ ( x 0 ) = f ′ ( x 0 ) \small {P_{n}}'\left ( x_{0} \right ) = {f}'\left ( x_{0} \right ) Pn(x0)=f(x0)

  3. 如果还要靠得更近,还要求曲线在 ( x 0 , f ( x 0 ) ) \small \left ( x_{0},f\left ( x_{0} \right ) \right ) (x0,f(x0)) 点弯曲方向相同,(如上图,弯曲方向相反 [ 绿色和红色图像 ];弯曲方向相同[ 蓝色和红色图像 ],明显在离 x 0 \small x_{0} x0 很远的地方,弯曲方向相同两函数的差异更小一点),即 P n ′ ′ ( x 0 ) = f ′ ′ ( x 0 ) \small {P_{n}}''\left ( x_{0} \right ) = {f}''\left ( x_{0} \right ) Pn′′(x0)=f′′(x0) ,进而可推想:若在 ( x 0 , f ( x 0 ) ) \small \left ( x_{0},f\left ( x_{0} \right ) \right ) (x0,f(x0)) 附近有 P n ′ ( x 0 ) = f ′ ( x 0 ) \small {P_{n}}'\left ( x_{0} \right ) = {f}'\left ( x_{0} \right ) Pn(x0)=f(x0) P n ′ ′ ( x 0 ) = f ′ ′ ( x 0 ) ⋯ ⋯ ⋯ P n ( n ) ( x 0 ) = f n ( x 0 ) \small {P_{n}}''\left ( x_{0} \right ) = {f}''\left ( x_{0} \right ) \small \cdots \cdots \cdots \small P_{n}^{\left ( n \right )}\left ( x_{0} \right ) = f^{n}\left ( x_{0} \right ) Pn′′(x0)=f′′(x0)⋯⋯⋯Pn(n)(x0)=fn(x0),近似程度越来越好。

综上所述,所要找的多项式应满足下列条件:
【数学】通俗理解泰勒公式(牛顿迭代法有用到)

  • 解释一下上面的转换时如何做的,以上面第三行的二阶导数为例:
    • 第一个箭头的转换:将 P n ( x ) \small P_{n}\left ( x \right ) Pn(x) 求二阶导函数后将 x 0 \small x_{0} x0 带入,求得 P n ′ ′ ( x 0 ) = 2 ! a 2 \small {P_{n}}''\left ( x_{0} \right ) = 2!a_{2} Pn′′(x0)=2!a2
    • 第二个箭头的转换:所以 f ′ ′ ( x 0 ) = 2 ! a 2 \small {f}''\left ( x_{0} \right ) = 2!a_{2} f′′(x0)=2!a2,所以 a 2 = 1 2 ! f ′ ′ ( x 0 ) \small a_{2} = \frac{1}{2!}{f}''\left ( x_{0} \right ) a2=2!1f′′(x0)

多项式函数 p n ( x ) = a 0 + a 1 ( x − x 0 ) + a 2 ( x − x 0 ) 2 + . . . + a n ( x − x 0 ) n p_n(x) = a_0 + a_1(x - x0) + a_2 (x - x0)^2 + ... + a_n (x - x0)^n pn(x)=a0+a1(xx0)+a2(xx0)2+...+an(xx0)n 中的系数 a \small a a 可以全部由 f ( x ) \small f\left ( x \right ) f(x) 表示,则得到:
【数学】通俗理解泰勒公式(牛顿迭代法有用到)
其中误差为 R n ( x ) = f ( x ) − P n ( x ) \small R_{n} \left ( x \right ) = f\left (x \right ) - P_{n}\left ( x \right ) Rn(x)=f(x)Pn(x)。 因为是用多项式函数去无限逼近给定的函数,所以两者之间肯定存在一丢丢的误差。

4. 泰勒公式的定义

所以我们就得到了泰勒公式的定义:

如果函数 f ( x ) \small f\left ( x \right ) f(x) 在含 x 0 \small x_{0} x0 的某个开区间 ( a , b ) \small \left ( a,b \right ) (a,b) 内具有直到 ( n + 1 ) \small \left ( n+1 \right ) (n+1) 阶导数,则对 ∀ x ∈ ( a , b ) \small \forall x \in \left ( a,b \right ) x(a,b),有:
【数学】通俗理解泰勒公式(牛顿迭代法有用到)
其中余项 (即误差) R n ( x ) = f ( n + 1 ) ( ξ ) ( n + 1 ) ! ( x − x 0 ) n + 1 \small R_{n}\left ( x \right ) = \frac{f^{\left ( n+1 \right )}(\xi )}{\left ( n+1 \right )!}(x-x_{0})^{n+1} Rn(x)=(n+1)!f(n+1)(ξ)(xx0)n+1 ξ \xi ξ x 0 \small x_{0} x0 x x x 之间。 泰勒公式的余项表达方式有好几种,前面这表示方法称为 n 阶泰勒展开式的拉格朗日余项。

  • 拉格朗日余项即是n阶泰勒公式又多展开了一阶,n 变为 n+1。
  • 注意,这里的余项即为误差,因为使用多项式函数在某点展开,逼近给定函数,最后肯定会有一丢丢的误差,我们称之为余项。

5. 扩展 — 麦克劳林公式

麦克劳林公式是泰勒公式的一种特殊情况:即当 x 0 = 0 \small x_{0} = 0 x0=0 时的泰勒公式。所以将 x 0 = 0 \small x_{0} = 0 x0=0 代入公式,即得:
【数学】通俗理解泰勒公式(牛顿迭代法有用到)
几个常见的初等函数的带有佩亚诺余项的麦克劳林公式:
【数学】通俗理解泰勒公式(牛顿迭代法有用到)
佩亚诺余项为 ( x − x 0 ) n \small \left ( x-x_{0} \right )^{n} (xx0)n 的高阶无穷小:
【数学】通俗理解泰勒公式(牛顿迭代法有用到)

参考

【1】https://blog.csdn.net/xiaojinger_123/article/details/127442655文章来源地址https://www.toymoban.com/news/detail-441304.html

到了这里,关于【数学】通俗理解泰勒公式(牛顿迭代法有用到)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • C语言每日一练——第154天:牛顿迭代法求方程根

    🌟 前言 Wassup guys,我是Edison 😎 今天是C语言每日一练,第154天! Let’s get it! 编写用牛顿迭代法求方程根的函数。   方程为 a x 2 + b x 2 + c x + d = 0 ax^2+bx^2+cx+d=0 a x 2 + b x 2 + c x + d = 0 ,系数a,b,c,d 由主函数输入。   求 x x x 在 1 1 1 附近的一个实根。求出根后,由主函数输

    2024年01月23日
    浏览(46)
  • 牛顿(Newton)迭代法求解非线性方程以及方程组的Matlab实现

    必做题目比较简单,写得有些随意,主要还是第二个拓展题目的难度比较高 传入题设数据有: 另附运行截图  

    2024年02月11日
    浏览(49)
  • 数学建模算法(基于matlab和python)之 线性方程组的迭代法(雅可比迭代、高斯-赛德尔迭代)(7/10)

    实验目的及要求: 1、了解各迭代法的基本原理和特点; 2、判断雅克比迭代、高斯-塞德尔迭代对任意初始向量的收敛性; 3、完成雅克比迭代、高斯-塞德尔迭代算法的程序实现。 实验内容: 1、编写雅可比迭代法与高斯-赛德尔迭代法通用子程序,求解下列线性方程组 ,并考

    2024年02月04日
    浏览(51)
  • 雅可比迭代和高斯—赛德尔迭代法

           对于线性方程组AX=b,我们首先将系数矩阵A分解为对角矩阵D、下三角矩阵L和上三角矩阵U:   在这里,我们求解下面的带状方程(以下程序均是以求解该带状方程为例): .............           高斯—赛德尔迭代法是再雅可比迭代法的基础上,在计算 时尽可能地用最

    2024年01月25日
    浏览(45)
  • 松弛(SOR)迭代法

            松弛迭代法是在雅可比迭代法和高斯——赛德尔迭代法的基础上,以w0为松弛因子,建立迭代格式如下: 即         我们将线性方程组AX=b的系数矩阵A分解成一个对角矩阵D、一个下三角矩阵L和一个上三角矩阵D,即A=D-L-U,则有:                        当w=1时,

    2024年02月04日
    浏览(45)
  • 3.4 迭代法

        雅可比迭代法是一种用于求解线性方程组的迭代算法,其基本思想是将线性方程组中的系数矩阵拆分为对角线矩阵和非对角线矩阵两部分,并利用对角线矩阵的逆矩阵来迭代求解方程组。 具体地,设线性方程组为Ax=b,其中A为系数矩阵,b为常数向量,x为未知向量,雅可

    2024年02月08日
    浏览(46)
  • python算法二:迭代法

    1.定义:迭代法也称辗转法,是一种不断用变量的旧值递推新值的过程,跟迭代法相对应的是直接法(或者称为一次解法),即一次性解决问题。迭代算法是用计算机解决问题的一种基本方法,它利用计算机运算速度快、适合做重复性操作的特点,让计算机对一组指令(或一定步

    2024年02月06日
    浏览(56)
  • 数值分析-高斯塞得尔迭代法

    高斯-赛德尔迭代(Gauss–Seidel method)是数值线性代数中的一个迭代法,可用来求出线性方程组解的近似值。该方法以卡尔·弗里德里希·高斯和路德维希·赛德尔命名。 同雅可比法一样,高斯-赛德尔迭代是基于矩阵分解原理。(源自百度百科) 版本一 版本二 与雅克比迭代法

    2024年02月11日
    浏览(47)
  • 程序设计基础实例大全(1.迭代法)

    本博文最先发表于知乎网 程序设计最为常用的计算方法有枚举(Enumeration)、递推和递归(Recursion)等。暴力搜索(Brute-­force search)属于枚举法。 迭代法(Iteration)也是最为常用的一种方法。 1.1 阶乘之和 问题描述 计算S=1!+2!+…+n! 输入 一个正整数n,满足1≤n≤10。 输出 阶

    2024年02月07日
    浏览(45)
  • Jacobi迭代法的matlab程序(《数值分析原理》)

    Jacobi迭代法是常见的几种迭代法之一,迭代格式如下图所示:(图片来自CHD的ztl老师的PPT)(具体内容详见《数值分析原理》) 该例子使用matlab的命令文件格式,命名为jacobi.m。 举例:设有方程组 取初始向量为x (0)=(-3,1,1) (T),用Jacobi方法求解,要求||x (k+1)-x (k)||小于等于10…

    2023年04月08日
    浏览(43)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包