R2决定系数(R2 得分)详细计算

这篇具有很好参考价值的文章主要介绍了R2决定系数(R2 得分)详细计算。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

定义

      R2决定系数是对线性模型评估的一种评价指标,其值最大为1,最小为0,当值越接近于1,则说明模型越好;值越接近于0,则模型越差。

计算过程

使用 y i {\text{y}}_i yi表示真实的观测值,使用 y _ \overset{\_}{\mathop y} y_表示真实观测值的平均值,使用 y i ^ \overset{\hat{}}{\mathop {y_i}} yi^表示预测值,于是就产生下以下的指标:

  • 回归平方和(SSR)
    S S R = ∑ i = 1 n ( y i ^ − y − ) 2 SSR = \sum\limits_{i = 1}^n {(\overset{\hat{}}{\mathop {{y_i}}} - \overset{ - }{\mathop y} } {)^2} SSR=i=1n(yi^y)2估计值与平均值的误差,反映自变量与因变量之间的相关程度的偏差平方和

  • 残差平方和(SSE)
    S S E = ∑ i = 1 n ( y i − y i ^ ) 2 SSE = \sum\limits_{i = 1}^n {(\overset{{}}{\mathop {{y_i}}} - \overset{\hat{}}{\mathop {{y_i}}} } {)^2} SSE=i=1n(yiyi^)2即估计值与真实值的误差,反映模型拟合程度

  • 总离差平方和(SST)
    S S T = S S R + S S E = ∑ i = 1 n ( y i − y _ ) 2 SST = SSR + SSE = \sum\limits_{i = 1}^n {(\overset{{}}{\mathop {{y_i}}} - \overset{\_}{\mathop {{y_{}}}} } {)^2} SST=SSR+SSE=i=1n(yiy_)2即平均值和真实值之间的误差,反映与数学期望的偏离程度

  • R2 score ,即决定系数
    反映因变量的全部变异能通过回归关系被变量解释的比例,计算公式:
    R 2 = 1 − S S E SST {R^2} = 1 - \frac{{SSE}}{{{\text{SST}}}} R2=1SSTSSE R 2 = 1 − ∑ i = 1 n ( y i − y i ^ ) 2 ∑ i = 1 n ( y i − y _ ) 2 {R^2} = 1 - \frac{{\sum\nolimits_{i = 1}^n {{{({y_i} - \overset{\hat{}}{\mathop {{y_i}}} )}^2}} }}{{\sum\nolimits_{i = 1}^n {{{({y_i} - \overset{\_}{\mathop {{y_{}}}} )}^2}} }} R2=1i=1n(yiy_)2i=1n(yiyi^)2进一步化简为:
    R 2 = 1 − ∑ i ( y i − y ^ i ) 2 / n ∑ i ( y i − y _ ) 2 / n = 1 − M S E V a r {R^2} = 1 - \frac{{\sum\limits_i {{{({y_i} - {{\overset{\hat {}}{\mathop y} }_i})}^2}/n} }}{{\sum\limits_i {{{({y_i} - \overset{\_}{\mathop y} )}^2}/n} }} = 1 - \frac{{MSE}}{{Var}} R2=1i(yiy_)2/ni(yiy^i)2/n=1VarMSE如此一来,分子就变成了常用的评价指标,均方误差MSE,分母则变成了方差,对于 R 2 {R^2} R2
           可以通俗的理解为使用均值作为误差基准,看预测误差是否大于或者小于均值基准误差
    若:
           R2 score = 1,样本中预测值和真实值完全相等,没有任何误差,表示回归分析中自变量对因变量的解释越好
           R2 score = 0,此时分子等于分母,样本的每项预测值都等于均值

最后,是sklearn中的有关于模型评估的几个API:

import sklearn.metrics as sm  # 模型评估模块
# 拿到一组测试集模型进行模型评估
test_x = 测试变量数据集
test_y = 测试结果数据集

# 训练的模型,获取模型预测值
pred_test_y=model.predict(test_x)

# 平均绝对值误差 mae
print(sm.mean_absolute_error(test_y, pred_test_y))
# 平均平方误差:均方误差 mse
print(sm.mean_squared_error(test_y, pred_test_y))
# 中位数绝对偏差
print(sm.median_absolute_error(test_y, pred_test_y))
# r2_score
print(sm.r2_score(test_y,pred_test_y))

如有错误请联系作者改正,谢谢!文章来源地址https://www.toymoban.com/news/detail-439512.html

到了这里,关于R2决定系数(R2 得分)详细计算的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • MATLAB知识点: SSE: 误差平方和、 MSE: 均方误差、RMSE: 均方根误差、MAE: 平均绝对误差、MAPE: 平均绝对百分比误差、SMAPE: 对称平均绝对百分比误差、R方: 决定系数

    ​讲解视频:可以在bilibili搜索《MATLAB教程新手入门篇——数学建模清风主讲》。​ MATLAB教程新手入门篇(数学建模清风主讲,适合零基础同学观看)_哔哩哔哩_bilibili 节选自第3章 3.4.2 算术运算 学完了矩阵的算术运算后,我们来做一些练习。 假设真实值是向量 ,拟合值或

    2024年02月21日
    浏览(44)
  • VMware安装windows server 2008 r2详细教程

    VMware虚拟机安装Windows server 2012之前,要满足两个条件: 1、自己在本机上已经安装了“VMware Workstation Pro”这个软件(图标类似于这个,不同版本图标不太相同); 2、要有Windows server 2008 r2的镜像文件,以“iso”为后缀(文章后面附上下载链接)。 满足上面两个条件之后,我

    2024年02月05日
    浏览(55)
  • pytorch自定义算子并导出onnx计算图详细代码教程

    解决:     # enable_onnx_checker=False 更改为:     operator_export_type=torch.onnx.OperatorExportTypes.ONNX_ATEN_FALLBACK pytorch自定义算子并导出onnx计算图详细代码教程_operatorexporttypes_蛇皮小娃娃的博客-CSDN博客  

    2024年02月10日
    浏览(44)
  • Web 基尼系数的计算

    2024年01月23日
    浏览(47)
  • python计算相关系数R

    方法一: 方法二 参考:https://mp.weixin.qq.com/s/nABJf4WBR4Y4oEZiYKPK4Q

    2024年02月13日
    浏览(38)
  • js计算皮尔逊相关系数

    代码如下; 调用:  效果:

    2024年01月25日
    浏览(41)
  • 傅里叶级数系数的完整详细算法

    傅里叶级数系数的完整详细算法 一、三角函数相关公式和定积分 在分析傅里叶级数之前,一定要先熟悉三角函数的相关公式,以及三角函数的积分。 1、两角和公式: sin( α + β ) = sin( α ) * cos( β ) + cos( α ) * sin( β ) sin( α - β ) = sin( α ) * cos( β ) - cos( α ) * sin( β ) cos( α + β

    2024年02月04日
    浏览(36)
  • MATLAB 自定义实现点云法向量和曲率计算(详细解读)(64)

    首先说明: ------这里代码手动实现,不调用matlab提供的法向量计算接口,更有助于大家了解法向量和曲率的计算方法,步骤清晰,属于点云处理的深入,相信如何从点云坐标得到每个点的法向量和曲率会在看完代码后完全了解,进而即使用别的语言也能完全按照这个步骤实现

    2024年04月14日
    浏览(36)
  • 众智科学:计算聚集系数和邻里重叠度

    实验内容: 输入:任意的 有向图 输出: 1)每个节点的聚集系数 2)每个节点对的邻里重叠度 相关定义介绍: 聚集系数:节点A的聚集系数 = A的任意两个朋友之间也是朋友的概率(即邻居间朋友对的个数除以总对数) 邻里重叠度:与A、B均为邻居的节点数/ 与节点A、B中至少

    2024年02月16日
    浏览(39)
  • 信度系数的计算公式你了解吗?

    信度分析用于测量样本回答结果是否可靠,即样本有没有真实作答量表类题项。 重要提示: 信度分析仅仅是针对 量表数据,非量表数据一般不进行信度分析。 1.SPSSAU操作如下图: SPSSAU仪表盘 2.案例背景 此案例分析心理学中研究运动员意志品质的调查问卷数据,共对312人进行

    2024年02月05日
    浏览(43)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包