【scipy 基础】--正交距离回归

这篇具有很好参考价值的文章主要介绍了【scipy 基础】--正交距离回归。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

ScipyODR正交距离回归(ODR-Orthogonal Distance Regression)模块,适用于回归分析时,因变量和自变量之间存在非线性关系的情况。
它提高了回归分析的准确性和稳健性。对于需要解决非线性回归问题的科研人员和工程师来说,它具有非常重要的意义。

ODR正交距离回归模块的作用主要在于它将正交化方法和距离回归结合起来,解决了传统线性回归模型在处理非线性问题时的局限性。它通过将自变量进行正交化处理,使得因变量和自变量之间的非线性关系能够更好地被拟合出来。

1. 主要功能

scipy.odr模块针对的领域比较明确,所以不像之前介绍的模块有那么多函数。
此模块的主要函数包括:

函数名 说明
Data 要拟合的数据
RealData 数据的权重为实际标准差和/或协方差
Model Model 类存储有关您希望拟合的函数的信息
ODR ODR 类收集所有信息并协调主要拟合例程的运行
Output 输出类存储 ODR 运行的输出
其他函数 调整拟合和模型的一些函数

一般来说,使用前5个函数,就可以进行一些正交距离回归分析。

2. 使用示例

正交距离分析一般步骤如下:

【scipy 基础】--正交距离回归

2.1. 准备数据

数据采用以前收集的江苏省人口数据,获取地址:https://databook.top/jiangsustat/renkou

import pandas as pd

data = pd.read_csv("/path/to/人口-年末常住人口(万人).csv")
data.head(10)

【scipy 基础】--正交距离回归
一共31条数据,1990年~2020年江苏省的人口变化数据。

用散点图看看数据的变化趋势:

from matplotlib.ticker import MultipleLocator
import matplotlib.pyplot as plt

ax = plt.subplot()
ax.scatter(data["year"], data["value"], marker='*', color='r')
ax.xaxis.set_major_locator(MultipleLocator(5))
ax.set_title("江苏省人口变化")

plt.show()

【scipy 基础】--正交距离回归

2.2. 创建模型

使用scipy.odr模块中的Model函数创建一个拟合的模型。

import scipy.odr as sodr

# 模型函数
def model_func(p, x):
    k, b = p
    return k * x + b

model = sodr.Model(model_func)

2.3. 生成数据

将上面的人口数据data转换为可以用于ODR运算的数据。

# x是数据
x = range(len(data))

# 转换数据用RealData或者Data函数都可以
rdata = sodr.RealData(x, data["value"])
# rdata = sodr.Data(x, data["value"])

DataRealData函数都是用来构造数据的。
一般来说,Data函数用来构造理论数据;
RealData函数用来构造实际数据的,且RealData中还可以设置权重。

这里没有设置权重,用哪个函数都可以。

2.4. ODR运算

有了数据和模型之后,就可以进行ODR运算了。

odr = sodr.ODR(rdata, model, beta0=[0, 1])

result = odr.run()
result.pprint()
# 运行结果:
Beta: [  61.01340781 6724.77566283]
Beta Std Error: [ 1.11208495 19.3974215 ]
Beta Covariance: [[  1.51592414 -22.73886321]
 [-22.73886321 461.20026764]]
Residual Variance: 0.8158277156001223
Inverse Condition #: 0.2520617152422754
Reason(s) for Halting:
  Sum of squares convergence

其中 BetaBeta Std Error就拟合的参数值和参数的标准差。

2.5. 输出结果

根据计算结果,绘制出图形更容易理解。

# 拟合参数和参数的标准差
beta = result.beta
beta_std = result.sd_beta

# 拟合的曲线
y = beta[0] * x + beta[1]

# 拟合曲线的标准差上限
y_up = (beta[0] + beta_std[0]) * x + (beta[1]+ beta_std[1])

# 拟合曲线的标准差下限
y_down = (beta[0] - beta_std[0]) * x + (beta[1] - beta_std[1])

# 绘制拟合的曲线
ax = plt.subplot()
ax.scatter(data["year"], data["value"], marker='*', color='r')
ax.xaxis.set_major_locator(MultipleLocator(5))
ax.set_title("江苏省人口变化")

ax.plot(x, y, color="b", label="拟合曲线")
ax.plot(x, y_up, color="y", label="标准差上限")
ax.plot(x, y_down, color="g", label="标准差下限")

plt.legend()
plt.show()

【scipy 基础】--正交距离回归

这就是通过ODR模块拟合的人口变化情况。

3. 总结

ODR正交距离回归之所以作为Scipy的单独模块,是因为它是一种特殊的曲线拟合方法,
它使用正交化和距离加权的最小二乘法来处理具有非线性关系的输入变量,并旨在找到最优的模型以最小化预测误差。
这与一般的曲线拟合在方法和目标上有很大的不同。

后续介绍Scipy库中的其他模块时,还会介绍其他的曲线拟合函数,到时候可以和这里的ODR方法对照比较一下。文章来源地址https://www.toymoban.com/news/detail-746401.html

到了这里,关于【scipy 基础】--正交距离回归的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【scipy 基础】--最优化

    SciPy 库的 optimize 模块主要用于执行各种优化任务。 优化 是寻找特定函数的最小值或最大值的过程,通常用于机器学习、数据分析、工程和其他领域。 scipy.optimize 提供了多种优化算法,包括梯度下降法、牛顿法、最小二乘法等,可以解决各种复杂的优化问题。 该模块还包含

    2024年02月05日
    浏览(31)
  • 【scipy 基础】--图像处理

    SciPy 库本身是针对科学计算而不是图像处理的,只是图像处理也包含了很多数学计算, 所以 Scipy 也提供了一个专门的模块 ndimage 用于图像处理。 ndimage 模块提供的功能包括输入/输出图像、显示图像、基本操作(如裁剪、翻转、旋转等)、图像过滤(如去噪、锐化等)、图像

    2024年02月05日
    浏览(42)
  • 【scipy 基础】--聚类

    物以类聚, 聚类算法 使用最优化的算法来计算数据点之间的距离,并将它们分组到最近的簇中。 Scipy 的聚类模块中,进一步分为两个聚类子模块: vq (vector quantization):提供了一种基于向量量化的聚类算法。 vq模块 支持多种向量量化算法,包括 K-means 、 GMM (高斯混合模

    2024年02月06日
    浏览(26)
  • 【scipy 基础】--统计分布

    scipy.stats 子模块包含大量的概率分布、汇总和频率统计、相关函数和统计测试、掩蔽统计、核密度估计、准蒙特卡罗功能等等。 这个子模块可以帮助我们描述和分析数据,进行假设检验和拟合统计模型等。 具体来说, scipy.stats 子模块包括以下主要功能: 类别 说明 连续统计

    2024年02月05日
    浏览(31)
  • 【scipy 基础】--线性代数

    SciPy 的 linalg 模块是 SciPy 库中的一个子模块,它提供了许多用于线性代数运算的函数和工具,如矩阵求逆、特征值、行列式、线性方程组求解等。 相比于 NumPy的linalg模块 , SciPy的linalg模块 包含更多的高级功能,并且在处理一些特定的数值计算问题时,可能会表现出更好的性

    2024年02月05日
    浏览(28)
  • 【scipy 基础】--傅里叶变换

    傅里叶变换 是一种数学变换,它可以将一个函数或信号转换为另一个函数或信号,它可以将时域信号转换为频域信号,也可以将频域信号转换为时域信号。 在很多的领域都有广泛的应用,例如信号处理、通信、图像处理、计算机科学、物理学、生物学等。 它最大的功能是能

    2024年02月06日
    浏览(30)
  • 【scipy 基础】--积分和微分方程

    对于手工计算来说,积分计算是非常困难的,对于一些简单的函数,我们可以直接通过已知的积分公式来求解,但在更多的情况下,原函数并没有简单的表达式,因此确定积分的反函数变得非常困难。 另外,相对于微分运算来说,积分运算则具有更多的多样性,包括不同的积

    2024年02月05日
    浏览(32)
  • 【Python】计算几何:德劳内三角剖分算法 | 利用 scatter 绘制散点图 | 实现外接圆生成 | scipy库的 Dealunay 函数 | 实战: A-B间欧氏距离计算

       猛戳!跟哥们一起玩蛇啊  👉 《一起玩蛇》🐍 💭 写在前面 :本章我们将介绍的是计算机和领域的 Delaunay 三角剖分算法(即德劳内三角剖分),它是一种用于将点集划分成三角形网格的算法。点集的三角剖分属于计算几何学科范畴,对数值分析、有限元分析与图形学

    2024年02月02日
    浏览(32)
  • 【计算几何】Python:德劳内三角剖分算法 | 利用 scatter 绘制散点图 | 实现外接圆生成 | scipy库的 Dealunay 函数 | 实战: A-B间欧氏距离计算

       猛戳!跟哥们一起玩蛇啊  👉 《一起玩蛇》🐍 💭 写在前面 :本章我们将介绍的是计算机和领域的 Delaunay 三角剖分算法(即德劳内三角剖分),它是一种用于将点集划分成三角形网格的算法。点集的三角剖分属于计算几何学科范畴,对数值分析、有限元分析与图形学

    2024年02月03日
    浏览(29)
  • 【Scipy优化使用教程】二、Scipy中有约束优化的两种算法

    参考官网:Scipy. 对于有约束的最小化问题, Scipy 提供的 minimize 这个包有三个: trust-constr , SLSQP\\\' 和 COBYLA 。它们要求使用稍微不同的结构来定义约束。 trust-constr 需要要求约束被定义成一系列的 LinearConstraint 和 NonlinearConstraint 两种类型。 SLSQP\\\' 和 COBYLA 需要要求约束条件被定义

    2024年02月02日
    浏览(34)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包