KDE窗宽选择中的最小二乘交错间定法

这篇具有很好参考价值的文章主要介绍了KDE窗宽选择中的最小二乘交错间定法。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

窗宽参数的选择方法, 一般有经验法, 插入法, 交错鉴定法等方法. 以下介绍最小二乘交错鉴定法, 并将其作为本文的窗宽选择方法.

最小二乘交错鉴定法(Least-squares cross-validation,LSCV)是是基于这样的思想, 即选取的窗宽参数值能够最小化估计函数的积分平方误差. 以下先考虑单变量的情形.

定义 f ^ ( x ) \hat{f}(x) f^(x) f ( x ) f(x) f(x)之差的平方的积分为
∫ [ f ^ ( x ) − f ( x ) ] 2 d x = ∫ f ^ ( x ) 2 d x − 2 ∫ f ^ ( x ) f ( x ) d x + ∫ f ( x ) 2 d x \begin{equation} \int[\hat{f}(x) - f(x)]^2dx = \int\hat{f}(x)^2dx -2\int\hat{f}(x)f(x)dx +\int f(x)^2dx \end{equation} [f^(x)f(x)]2dx=f^(x)2dx2f^(x)f(x)dx+f(x)2dx
( 4 ) (4) (4)的右边第三项和 h h h无关, 所以最小化(4)等价于最小化
∫ f ^ ( x ) 2 d x − 2 ∫ f ^ ( x ) f ( x ) d x \begin{equation} \int\hat{f}(x)^2dx -2\int\hat{f}(x)f(x)dx \end{equation} f^(x)2dx2f^(x)f(x)dx

为了最小化式 ( 5 ) (5) (5), 我们先观察式 ( 5 ) (5) (5)的结构. 第一项 ∫ f ^ ( x ) 2 d x \large \int\hat{f}(x)^2dx f^(x)2dx可以用下面的式子估计:
∫ f ^ ( x ) 2 d x = 1 n 2 h 2 ∑ i = 1 n ∑ j = 1 n ∫ k ( X i − x h ) k ( X j − x h ) d x = 1 n 2 h ∑ i = 1 n ∑ j = 1 n k ˉ ( X i − X j h ) \begin{equation} \begin{aligned} \int\hat{f}(x)^2dx =& \frac{1}{n^2h^2}\sum_{i=1}^n\sum_{j=1}^n \int k(\frac{X_i-x}{h}) k(\frac{X_j-x}{h}) dx \\ =& \frac{1}{n^2h}\sum_{i=1}^n\sum_{j=1}^n\bar{k}(\frac{X_i-X_j}{h}) \end{aligned} \end{equation} f^(x)2dx==n2h21i=1nj=1nk(hXix)k(hXjx)dxn2h1i=1nj=1nkˉ(hXiXj)

其中 k ˉ ( v ) = ∫ k ( u ) k ( v − u ) d u \bar{k}(v) = \int k(u)k(v-u)du kˉ(v)=k(u)k(vu)du称为 k ( v ) k(v) k(v)的双重卷积核. 例如, 对于标准正态核$ k(v) = \frac{1}{\sqrt{2\pi}}e{-\frac{1}{2}v2} , 其双重卷积核为 , 其双重卷积核为 ,其双重卷积核为 \bar{k}(v) = \frac{1}{\sqrt{4\pi}}e{-\frac{1}{4}v2}$, 也就是一个均值为0, 方差为2的正态概率密度函数.

而式 ( 5 ) (5) (5)的第二项中的 ∫ f ^ ( x ) f ( x ) d x \int\hat{f}(x)f(x)dx f^(x)f(x)dx, 其实就是随机变量函数 f ^ ( X ) \hat{f}(X) f^(X)的期望, 可以写为 E X [ f ^ ( X ) ] E_X[\hat{f}(X)] EX[f^(X)]. 而对于期望, 我们可以用其样本均值对其进行估计, 也就是用下式
E X ^ [ f ^ ( X ) ] = 1 n ∑ i = 1 n f ^ − i ( X i ) \begin{equation} \hat{E_X}[\hat{f}(X)] = \frac{1}{n}\sum_{i=1}^n \hat{f}_{-i}(X_i) \end{equation} EX^[f^(X)]=n1i=1nf^i(Xi)

其中
f ^ − i ( X i ) = 1 ( n − 1 ) h   ∑ j = 1 , j ≠ i n k ( X i − X j h ) \begin{equation} \hat{f}_{-i}(X_i) = \frac{1}{(n-1)h} \ \sum_{j=1, j\neq i}^n k(\frac{X_i-X_j}{h}) \end{equation} f^i(Xi)=(n1)h1 j=1,j=ink(hXiXj)

( 8 ) (8) (8)称为 f ( X i ) f(X_i) f(Xi)的去一核估计量(leave-one-out kernal estimator).

因此, 我们可以将式 ( 4 ) (4) (4)定义最小二乘交错鉴定法的目标函数
C V f ( h ) = 1 n 2 h ∑ i = 1 n ∑ j = 1 n k ˉ ( X i − X j h ) − 1 n ( n − 1 ) h   ∑ j = 1 , j ≠ i n k ( X i − X j h ) \begin{equation} CV_f(h) = \frac{1}{n^2h}\sum_{i=1}^n\sum_{j=1}^n\bar{k}(\frac{X_i-X_j}{h}) - \frac{1}{n(n-1)h} \ \sum_{j=1, j\neq i}^n k(\frac{X_i-X_j}{h}) \end{equation} CVf(h)=n2h1i=1nj=1nkˉ(hXiXj)n(n1)h1 j=1,j=ink(hXiXj)

并将单变量KDE方法的窗宽选择转化为以下优化问题:
min ⁡ h    C V f ( h ) \begin{equation} \min \limits_h\ \ CV_f(h) \end{equation} hmin  CVf(h)文章来源地址https://www.toymoban.com/news/detail-498646.html

到了这里,关于KDE窗宽选择中的最小二乘交错间定法的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 最小二乘问题,,而不是方法

    最小二乘是一大类问题,而不是一个简单的方法 适用于 :线性(非线性)方程组问题,如果观测带有噪声,我们需要建立最小二乘模型。如果噪声符合高斯分布,即最小二乘问题的解对应于原问题的最大似然解。 如果方程组是线性的(很好将测量值和待估计值分离),我们

    2023年04月08日
    浏览(44)
  • 最小二乘问题和非线性优化

    转载自此处,修正了一点小错误。 在求解 SLAM 中的最优状态估计问题时,我们一般会得到两个变量,一个是由传感器获得的实际观测值 z boldsymbol{z} z ,一个是根据目前估计的状态量和观测模型计算出来的预测值 h ( x ) h(boldsymbol{x}) h ( x ) 。求解最优状态估计问题时通常我们

    2024年02月13日
    浏览(40)
  • uwb最小二乘空间定位+python模拟

    传统最小二乘空间定位原理 假设UWB定位系统里有n个基站。基站坐标设为 ( x i , y i , z i ) (x_{i},y_{i},z_{i}) ( x i ​ , y i ​ , z i ​ ) (i=1,2,3…),标签坐标为(x,y,z),标签到基站的距离设为 d i ( i = 1 , 2 , 3... ) d_{i}(i=1,2,3...) d i ​ ( i = 1 , 2 , 3... ) 可得以下关系式 { ( x − x 1 ) 2 + ( y − y

    2024年02月19日
    浏览(44)
  • 偏最小二乘(PLS)原理分析&Python实现

    目录 1  偏最小二乘的意义 2​ ​​​​​​PLS实现步骤 3 弄懂PLS要回答的问题 4 PLS的原理分析 4.1 自变量和因变量的主成分求解原理 4.1.1 确定目标函数 4.1.2 投影轴w1和v1的求解 4.2 求解回归系数 5 第3章问题解答 5.1 PCA原理 5.2 为什么要对X、Y标准化? 5.3 如何求自变量和因

    2024年01月20日
    浏览(43)
  • 数学建模常用模型(九) :偏最小二乘回归分析

    偏最小二乘回归(Partial Least Squares Regression,PLS Regression)是一种常用的统计建模方法,用于解决多元线性回归中自变量间高度相关的问题。在偏最小二乘回归中,通过将原始自变量转换为一组新的综合变量(称为主成分或潜在变量),然后再使用这些主成分进行回归分析,从

    2024年02月16日
    浏览(49)
  • 【算法系列】非线性最小二乘求解-梯度下降法

    ·【算法系列】卡尔曼滤波算法 ·【算法系列】非线性最小二乘求解-直接求解法 ·【算法系列】非线性最小二乘求解-梯度下降法 ·【算法系列】非线性最小二乘-高斯牛顿法  ·【算法系列】非线性最小二乘-列文伯格马夸尔和狗腿算法  文章目录 系列文章 文章目录 前言 一、

    2024年02月16日
    浏览(43)
  • 26 用lsqnonlin求解最小二乘问题(matlab程序)

    1. 简述        函数语法 x = lsqnonlin(fun,x0) 函数用于: 解决非线性最小二乘(非线性数据拟合)问题 解决非线性最小二乘曲线拟合问题的形式 变量x的约束上下限为ub和lb, x = lsqnonlin(fun,x0)从x0点开始,找到fun中描述的函数的最小平方和。函数fun应该返回一个向量(或数组),而不

    2024年02月15日
    浏览(58)
  • 代理模型:最小二乘支持向量回归(LSSVR)--- MATLAB程序

    写在开头:       代理模型是工程问题中常用的一个优化方法。当实际问题计算量很大、不容易求解时,可以使用计算量较小、求解迅速的简化模型来替代原模型,加速优化过程。代理模型采用一个数据驱动的、自下而上的办法来建立:首先,通过抽样得到有限个样本点【输

    2024年02月08日
    浏览(49)
  • 线性代数Python计算:线性方程组的最小二乘解

    给定ℝ上无解线性方程组 A x = b boldsymbol{Ax}=boldsymbol{b} Ax = b ,构造 A T A boldsymbol{A}^text{T}boldsymbol{A} A T A 及 A T b boldsymbol{A}^text{T}boldsymbol{b} A T b ,然后调用博文《线性方程组的通解》定义的mySolve函数,解方程组 A T A x = A T b boldsymbol{A}^text{T}boldsymbol{Ax}=boldsymbol{A}^text{T

    2023年04月08日
    浏览(59)
  • 偏最小二乘(Partial Least Squares,PLS)原理及模型建立

    随着对数据驱动的工业检测与诊断方法的逐步深入,过程监测的多元统计需要总结的东西越来越多,那么今天来整理一下。 内容较多,理论较复杂,建议细品,你品!最好推一遍~ It’s time to conclude PLS!!! PCA和偏最小二乘(PLS)是从 数据中描述正常情况 的首选方法。 天气

    2024年02月16日
    浏览(47)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包