MATLAB - 评估拟合优度、评价拟合效果

这篇具有很好参考价值的文章主要介绍了MATLAB - 评估拟合优度、评价拟合效果。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

系列文章目录



前言


一、如何评估拟合优度

用一个或多个模型拟合数据后,您应该评估拟合的好坏。第一步应该是目测 "曲线拟合器 "应用程序中显示的拟合曲线。除此之外,工具箱还提供了这些方法来评估线性和非线性参数拟合的拟合优度:

  • 拟合优度统计

  • 残差分析

  • 置信度和预测边界

正如统计文献中常见的那样,"拟合优度 "一词在这里有多种含义: 一个 "拟合良好 "的模型可能是

  • 根据最小二乘法拟合的假设,您的数据可以合理地来自该模型

  • 模型系数的估计不确定性很小

  • 能解释数据中很大一部分变异性,并能很有把握地预测新的观测结果。

特定应用可能还要求模型拟合的其他方面,这些方面对于实现良好拟合也很重要,例如一个易于解释的简单模型。本文介绍的方法可以帮助您确定所有这些意义上的拟合优度。

这些方法分为两类:图解法和数值法。绘制残差和预测边界是图形方法,有助于直观解释,而计算拟合优度统计量和系数置信区间则是数字方法,有助于统计推理。

一般来说,图形测量比数值测量更有优势,因为图形测量可以让您一次性查看整个数据集,而且可以轻松显示模型与数据之间的各种关系。而数值度量则更多地关注数据的某一特定方面,通常会试图将这些信息压缩成一个单一的数字。实际上,根据您的数据和分析要求,您可能需要使用这两种类型来确定最佳拟合。

请注意,根据这些方法,可能没有一种拟合适合您的数据。在这种情况下,您可能需要选择不同的模型。也有可能所有的拟合优度都表明某个拟合模型是合适的。但是,如果您的目标是提取具有物理意义的拟合系数,但您的模型并不能反映数据的物理特性,那么得出的系数就毫无用处。在这种情况下,了解数据代表什么以及如何测量数据与评估拟合度同样重要。

二、拟合优度统计

使用图形方法评估拟合优度后,应检查拟合优度统计量。曲线拟合工具箱™ 软件支持参数模型的拟合优度统计:

  • 误差平方和 (SSE)

  • R 平方

  • 误差自由度 (DFE)

  • 调整后的 R 平方

  • 均方根误差 (RMSE)

对于当前拟合,这些统计信息会显示在曲线拟合器应用程序的 "结果 "窗格中。对于当前曲线拟合会话中的所有拟合,可以在 "拟合表 "窗格中比较拟合优度统计量。

要在命令行下检查拟合优度统计,可以选择

  • 在曲线拟合器应用程序中,将拟合结果和拟合优度导出至工作区。在 "曲线拟合器 "选项卡的 "导出 "部分,单击 "导出 "并选择 “导出到工作区”。

  • 使用拟合函数指定 gof 输出参数。

2.1 SSE - 误差引起的平方和

该统计量用于衡量响应值与拟合响应值的总偏差。也称为残差平方和,通常标记为 SSE。
S S E = ∑ i = 1 n w i ( y i − y ^ i ) 2 S S E=\sum_{i=1}^{n}w_{i}(y_{i}-\widehat{y}_{i})^{2} SSE=i=1nwi(yiy i)2

数值越接近 0,表明模型的随机误差成分越小,拟合结果对预测越有用。

2.2 R 平方

该统计量衡量拟合在解释数据变化方面的成功程度。换一种说法,R 平方是响应值与预测响应值之间相关性的平方。它也被称为多重相关系数的平方和多重决定系数。

R 平方定义为回归平方和(SSR)与总平方和(SST)之比。SSR 的定义是
S S R = ∑ i = 1 n w i ( y ^ i − y ˉ ) 2 S S R=\sum_{i=1}^{n}w_{i}(\hat{y}_{i}-\bar{y})^{2} SSR=i=1nwi(y^iyˉ)2

SST 也称为均值平方和,其定义为

S S T = ∑ i = 1 n w i ( y i − y ‾ ) 2 {S S T}=\sum_{i=1}^{n}w_{i}(y_{i}-{\overline{{y}}})^{2} SST=i=1nwi(yiy)2

其中,SST = SSR + SSE。根据这些定义,R 方表示为
R − s q u a r e = S S R S S T = 1 − S S E S S T \mathrm{R} \mathrm{{-square}}={\frac{S S R}{SS T}}=1-{\frac{S S E}{S S T}} Rsquare=SSTSSR=1SSTSSE

R-square 的值可以在 0 和 1 之间任意取值,值越接近 1,说明模型解释的变异比例越大。例如,R 平方值为 0.8234 意味着拟合解释了平均值数据总变异的 82.34%。

如果增加模型中拟合系数的数量,虽然拟合效果在实际意义上可能没有改善,但 R 平方却会增加。为了避免这种情况,您应该使用下面描述的自由度调整 R 平方统计量。

请注意,对于不包含常数项的方程,R 平方有可能为负值。因为 R 平方被定义为拟合所解释的方差比例,如果拟合实际上比仅仅拟合一条水平线更差,那么 R 平方就是负值。在这种情况下,R 平方不能解释为相关性的平方。这种情况表明模型中应加入常数项。

2.3 自由度调整 R 平方

该统计量使用上文定义的 R 平方统计量,并根据残差自由度对其进行调整。残差自由度的定义是响应值 n 的数量减去根据响应值估计的拟合系数 m 的数量。
ν = n − m \nu=n-m ν=nm

v 表示计算平方和所需的涉及 n 个数据点的独立信息的数量。请注意,如果参数是有界的,且一个或多个估计值处于其边界,则这些估计值被视为固定值。自由度随此类参数的数量而增加。

当比较两个嵌套模型时,调整后的 R 平方统计量通常是拟合质量的最佳指标。
a d j u s t e d   R − s q u a r e = 1 − S S E ( n − 1 ) S S T ( ν ) \mathrm{adjusted~R}\mathrm{-square}=1-\frac{S S E(n-1)}{S S T(\nu)} adjusted Rsquare=1SST(ν)SSE(n1)

调整后的 R 平方统计量可以是小于或等于 1 的任何数值,数值越接近 1 表示拟合度越高。当模型中包含的项无助于预测响应时,就会出现负值。

2.4 均方根误差

该统计量也称为拟合标准误差和回归标准误差。它是对数据中随机成分的标准偏差的估计,定义为
R M S E = s = M S E R M S E=s={\sqrt{M S E}} RMSE=s=MSE

其中,MSE 是均方误差或残差均方
M S E = S S E ν M S E={\frac{S S E}{\nu}} MSE=νSSE

与 SSE 一样,MSE 值接近 0 表示拟合结果更有利于预测。

三、MATLAB - 评估曲线拟合度

本示例展示了如何进行曲线拟合。

3.1 加载数据并拟合多项式曲线

load census
curvefit = fit(cdate,pop,'poly3','normalize','on')
curvefit = 
     Linear model Poly3:
     curvefit(x) = p1*x^3 + p2*x^2 + p3*x + p4
       where x is normalized by mean 1890 and std 62.05
     Coefficients (with 95% confidence bounds):
       p1 =       0.921  (-0.9743, 2.816)
       p2 =       25.18  (23.57, 26.79)
       p3 =       73.86  (70.33, 77.39)
       p4 =       61.74  (59.69, 63.8)

输出结果显示拟合模型方程、拟合系数以及拟合系数的置信区间。

3.2 绘制拟合方程、数据、残差和预测范围图

plot(curvefit,cdate,pop)

matlab 拟合优度检验,MATLAB 机器人与控制系统应用,matlab,python,算法,数据拟合,拟合优度,曲线拟合,numpy

绘制残差拟合图。

plot(curvefit,cdate,pop,'Residuals')

matlab 拟合优度检验,MATLAB 机器人与控制系统应用,matlab,python,算法,数据拟合,拟合优度,曲线拟合,numpy

绘制拟合预测范围图。

plot(curvefit,cdate,pop,'predfunc')

matlab 拟合优度检验,MATLAB 机器人与控制系统应用,matlab,python,算法,数据拟合,拟合优度,曲线拟合,numpy

3.3 评估指定点3的拟合效果

通过指定一个 x 值,在一个特定点上评估拟合结果,使用下面的表格:y = fittedmodel(x)。

curvefit(1991)
ans = 252.6690

3.4 评估多点拟合值

评估模型的矢量值,以推断 2050 年的情况。

xi = (2000:10:2050).';
curvefit(xi)
ans = 6×1

  276.9632
  305.4420
  335.5066
  367.1802
  400.4859
  435.4468

获取这些值的预测范围。

ci = predint(curvefit,xi)
ci = 6×2

  267.8589  286.0674
  294.3070  316.5770
  321.5924  349.4208
  349.7275  384.6329
  378.7255  422.2462
  408.5919  462.3017

在外推法拟合范围内绘制拟合和预测区间图。默认情况下,拟合会在数据范围内绘制。要查看拟合后的外推值,请在绘制拟合之前将坐标轴的 x 上限设置为 2050。要绘制预测区间,请使用 predobs 或 predfun 作为绘图类型。

plot(cdate,pop,'o')
xlim([1900,2050])
hold on
plot(curvefit,'predobs')
hold off

matlab 拟合优度检验,MATLAB 机器人与控制系统应用,matlab,python,算法,数据拟合,拟合优度,曲线拟合,numpy

3.5 获取模型方程

输入拟合名称可显示模型方程、拟合系数和拟合系数的置信区间。

curvefit
curvefit = 
     Linear model Poly3:
     curvefit(x) = p1*x^3 + p2*x^2 + p3*x + p4
       where x is normalized by mean 1890 and std 62.05
     Coefficients (with 95% confidence bounds):
       p1 =       0.921  (-0.9743, 2.816)
       p2 =       25.18  (23.57, 26.79)
       p3 =       73.86  (70.33, 77.39)
       p4 =       61.74  (59.69, 63.8)

如果只想获得模型方程,请使用公式。

formula(curvefit)
ans = 
'p1*x^3 + p2*x^2 + p3*x + p4'

3.6 获取系数名称和数值

通过名称指定系数。

p1 = curvefit.p1
p1 = 0.9210
p2 = curvefit.p2
p2 = 25.1834

获取所有系数名称。查看拟合方程(例如,f(x) = p1*x^3+… ) 来查看每个系数的模型项。

coeffnames(curvefit)
ans = 4x1 cell
    {'p1'}
    {'p2'}
    {'p3'}
    {'p4'}

获取所有系数值。

coeffvalues(curvefit)
ans = 1×4

    0.9210   25.1834   73.8598   61.7444

3.7 获取系数的置信区间

使用系数的置信界来帮助您评估和比较拟合。系数的置信区间决定了系数的准确性。界限相距甚远表示不确定性。如果线性系数的置信区间为零,这意味着您无法确定这些系数是否与零相差不大。如果某些模型项的系数为零,那么它们对拟合没有帮助。获取系数的置信区间
使用系数的置信界来帮助您评估和比较拟合。系数的置信区间决定了系数的准确性。界限相距甚远表示不确定性。如果线性系数的置信区间为零,这意味着您无法确定这些系数是否与零相差不大。如果某些模型项的系数为零,那么它们对拟合没有帮助。

confint(curvefit)
ans = 2×4

   -0.9743   23.5736   70.3308   59.6907
    2.8163   26.7931   77.3888   63.7981

3.8 检查拟合优度统计

要在命令行下获取拟合优度统计信息,您可以

  • 打开曲线拟合器应用程序。在 "曲线拟合器 "选项卡的 "导出 "部分,单击 "导出 "并选择 “导出到工作区”,将拟合结果和拟合优度导出到工作区。

  • 使用拟合函数指定 gof 输出参数。

重新创建拟合,指定 gof 和输出参数,以获取拟合优度统计信息和拟合算法信息。

[curvefit,gof,output] = fit(cdate,pop,'poly3','normalize','on')
curvefit = 
     Linear model Poly3:
     curvefit(x) = p1*x^3 + p2*x^2 + p3*x + p4
       where x is normalized by mean 1890 and std 62.05
     Coefficients (with 95% confidence bounds):
       p1 =       0.921  (-0.9743, 2.816)
       p2 =       25.18  (23.57, 26.79)
       p3 =       73.86  (70.33, 77.39)
       p4 =       61.74  (59.69, 63.8)
gof = struct with fields:
           sse: 149.7687
       rsquare: 0.9988
           dfe: 17
    adjrsquare: 0.9986
          rmse: 2.9682

output = struct with fields:
        numobs: 21
      numparam: 4
     residuals: [21x1 double]
      Jacobian: [21x4 double]
      exitflag: 1
     algorithm: 'QR factorization and solve'
    iterations: 1

绘制残差直方图,寻找大致正态分布。

histogram(output.residuals,10)

matlab 拟合优度检验,MATLAB 机器人与控制系统应用,matlab,python,算法,数据拟合,拟合优度,曲线拟合,numpy

3.9 绘制拟合图、数据图和残差图

plot(curvefit,cdate,pop,'fit','residuals')
legend Location SouthWest
subplot(2,1,1)
legend Location NorthWest

matlab 拟合优度检验,MATLAB 机器人与控制系统应用,matlab,python,算法,数据拟合,拟合优度,曲线拟合,numpy

3.10 查找方法

列出您可以使用的每种拟合的方法。

methods(curvefit)

cfit 类的方法:

argnames       category       cfit           coeffnames     coeffvalues    confint        dependnames    differentiate  feval          fitoptions     formula        indepnames     integrate      islinear       numargs        numcoeffs      plot           predint        probnames      probvalues     setoptions     type           

有关如何使用拟合方法的更多信息,请参阅 cfit。有关如何使用拟合方法的更多信息,请参阅 cfit。

四、MATLAB 代码

贴一个计算 R 方的代码文章来源地址https://www.toymoban.com/news/detail-843974.html

function [r2 rmse] = rsquare(y,f,varargin)
% Compute coefficient of determination of data fit model and RMSE
%
% [r2 rmse] = rsquare(y,f)
% [r2 rmse] = rsquare(y,f,c)
%
% RSQUARE computes the coefficient of determination (R-square) value from
% actual data Y and model data F. The code uses a general version of 
% R-square, based on comparing the variability of the estimation errors 
% with the variability of the original values. RSQUARE also outputs the
% root mean squared error (RMSE) for the user's convenience.
%
% Note: RSQUARE ignores comparisons involving NaN values.
% 
% INPUTS
%   Y       : Actual data
%   F       : Model fit
%
% OPTION
%   C       : Constant term in model
%             R-square may be a questionable measure of fit when no
%             constant term is included in the model.
%   [DEFAULT] TRUE : Use traditional R-square computation
%            FALSE : Uses alternate R-square computation for model
%                    without constant term [R2 = 1 - NORM(Y-F)/NORM(Y)]
%
% OUTPUT 
%   R2      : Coefficient of determination
%   RMSE    : Root mean squared error
%
% EXAMPLE
%   x = 0:0.1:10;
%   y = 2.*x + 1 + randn(size(x));
%   p = polyfit(x,y,1);
%   f = polyval(p,x);
%   [r2 rmse] = rsquare(y,f);
%   figure; plot(x,y,'b-');
%   hold on; plot(x,f,'r-');
%   title(strcat(['R2 = ' num2str(r2) '; RMSE = ' num2str(rmse)]))
%   
% Jered R Wells
% 11/17/11
% jered [dot] wells [at] duke [dot] edu
%
% v1.2 (02/14/2012)
%
% Thanks to John D'Errico for useful comments and insight which has helped
% to improve this code. His code POLYFITN was consulted in the inclusion of
% the C-option (REF. File ID: #34765).

if isempty(varargin); c = true; 
elseif length(varargin)>1; error 'Too many input arguments';
elseif ~islogical(varargin{1}); error 'C must be logical (TRUE||FALSE)'
else c = varargin{1}; 
end

% Compare inputs
if ~all(size(y)==size(f)); error 'Y and F must be the same size'; end

% Check for NaN
tmp = ~or(isnan(y),isnan(f));
y = y(tmp);
f = f(tmp);

if c; r2 = max(0,1 - sum((y(:)-f(:)).^2)/sum((y(:)-mean(y(:))).^2));
else r2 = 1 - sum((y(:)-f(:)).^2)/sum((y(:)).^2);
    if r2<0
    % http://web.maths.unsw.edu.au/~adelle/Garvan/Assays/GoodnessOfFit.html
        warning('Consider adding a constant term to your model') %#ok<WNTAG>
        r2 = 0;
    end
end

rmse = sqrt(mean((y(:) - f(:)).^2));

到了这里,关于MATLAB - 评估拟合优度、评价拟合效果的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • MATLAB根据数据拟合曲线

    阿楠 零基础入门matlab教程基础版 阿楠 Simulink 模型创建 Matlab simulink建模与仿真视频教程

    2024年02月01日
    浏览(51)
  • Matlab 多项式拟合

    corrcoef函数 corrcoef函数用来计算矩阵相关系数。 (1)、corrcoef(x):若x为一个矩阵,返回的则是一个相关系数矩阵。 (2)、corrcoef(x,y):计算列向量x、y的相关系数,要求x、y具有相等的元素个数。如果x、y是矩阵,那么corrcoef函数会将其转换为列向量,相当于corrcoef([x(:),y(:)])。   p

    2024年02月11日
    浏览(46)
  • Matlab的插值与拟合

    插值:在离散数据的基础上补插连续函数,使得这条连续曲线通过全部给定的离散数据点。插值是离散函数逼近的重要方法,利用它可通过函数在有限个点处的取值状况,估算出函数在其他点处的近似值。 拟合:拟合是指已知某函数的若干离散函数值,通过调整该函数中若干

    2024年02月03日
    浏览(30)
  • MATLAB 曲线拟合

    MATLAB 曲线拟合 eg: 与数据插值类似,曲线拟合也是一种函数逼近的方法。 最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小优化误差的平方和来寻找数据的最佳函数匹配。 polyfit():多项式拟合系数 功能:求得最小二乘拟合多项式系数 调用格式: p=polyfit(X,Y,m

    2024年02月06日
    浏览(30)
  • MATLAB拟合算法

    与插值问题不同,在拟合问题中不需要曲线一定经过给定的点。拟合问题的目标是寻求一个函数(曲线),使得该曲线在某种准则下与所有的数据点最为接近,即曲线拟合的最好(最小化损失函数)。 插值算法中,得到的多项式f(x)要经过所有样本点。但是如果样本点太多,那么

    2023年04月09日
    浏览(30)
  • MATLAB实现函数拟合

    目录 一.理论知识 1.拟合与插值的区别 2.几何意义 3.误差分析 二.操作实现 1.数据准备 2.使用cftool——拟合工具箱  三.函数拟合典例 四.代码扩展 1.拟合与插值的区别 通俗的说,插值的本质是根据现有离散点的信息创建出更多的离散点,从而不断提高精度;而拟合则不需要找

    2024年02月09日
    浏览(34)
  • MATLAB--椭圆拟合算法

    This code aims for ellipse fitting but only contains the center’s calculation. 使用: xcell为x坐标数组,ycell为y坐标数组;

    2024年04月17日
    浏览(38)
  • MATLAB数据曲线拟合

    MATLAB数据曲线拟合 数据拟合是我们常用的一种方法,可以通过一组离散的数据点来找到一个函数,使这个函数能够对数据进行预测和描绘。在MATLAB中实现数据拟合非常简单,而且MATLAB还提供了许多工具箱来帮助我们完成这项任务。下面我们将会介绍如何使用MATLAB对数据进行曲

    2024年02月14日
    浏览(35)
  • 相关系数及其假设检验——matlab及spss实现

    数学建模中,相关性分析往往是建模的前提。但是,相关系数是数学建模中最容易出错滥用的点,需要注意不同相关系数的使用条件。 (1)总体的Pearson相关系数  (2)样本的Pearson相关系数  (3)Pearson相关系数的误区: 理解误区1——散点图和皮尔逊相关系数的联系(垂直

    2024年02月03日
    浏览(37)
  • Matlab 线性拟合、一维、多维度非线性拟合、多项式拟合

      线性拟合 我随便设定一个函数然后通过解方程计算出对应的系数 假设我的函数原型是 y=a*sin(0.1*x.^2+x)+b* squre(x+1)+c*x+d  拟合系数:   利用matlab实现非线性拟合(三维、高维、参数方程)_matlab多元非线性拟合_hyhhyh21的博客-CSDN博客 简单的一维的拟合: 思路: 将非线性-》线

    2024年02月12日
    浏览(46)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包