【Python】pandas中的std()函数—参数ddof的理解

这篇具有很好参考价值的文章主要介绍了【Python】pandas中的std()函数—参数ddof的理解。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

在利用pandas进行数据分析时,有时需要计算某一列数据的标准差,我们常用std()函数来实现,但是一般都没有关注过里面的一个重要参数ddof,本文就来介绍一下这个参数的理解。

ddof参数的取值一般有两个,即ddof=0或者ddof=1

ddof=0时:

当我们的参数取ddof=0时,计算的是总体标准差,计算公式为:
∑ i = 1 n ( x i − x ^ ) 2 n \sqrt{\frac{\sum \limits_{i=1}^{n}(x_i-\hat{x})^2}{n}} ni=1n(xix^)2
其中, X = { x 1 , x 2 , ⋯   , x n } X=\{x_1,x_2,\cdots,x_n\} X={x1,x2,,xn} x ^ \hat{x} x^表示为数据 x x x的均值,计算公式为:
x ^ = ∑ i = 1 n x i n \hat{x}=\frac{\sum \limits_{i=1}^nx_i}{n} x^=ni=1nxi
其中, n n n为总体个数。

ddof=1时:

当ddof=1时,计算的是样本的标准差,计算公式为:
∑ i = 1 n ( x i − x ^ ) 2 n − 1 \sqrt{\frac{\sum \limits_{i=1}^n(x_i-\hat{x})^2}{n-1}} n1i=1n(xix^)2
字母的代表方式与上文一样,只不过这里的 n n n表示的是样本的个数。

举例说明

我们在实际应用中看不同的计算方式得到的结果:

首先展示我们的数据集:

import numpy as np
import pandas as pd
data = pd.read_excel('EXE5_1.xlsx')
data

【Python】pandas中的std()函数—参数ddof的理解
我们分别考虑不同的ddof,并计算出标准差的数值:

std_ddof0 = np.std(data.iloc[:,1],ddof=0)
std_ddof0
40280.5706797213
std_ddof1 = np.std(data.iloc[:,1],ddof=1)
std_ddof1
41925.34721153412

可以明显的看出,ddof=1时,计算的数值偏大,是因为分母为 n − 1 n-1 n1文章来源地址https://www.toymoban.com/news/detail-416529.html

到了这里,关于【Python】pandas中的std()函数—参数ddof的理解的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 深入理解和应用C++ std::shared_ptr别名构造函数

    在现代C++中,智能指针是一个极为重要的工具,尤其std::shared_ptr以其自动内存管理、引用计数和多线程安全性等特性深受开发者喜爱。其中一个不太常用但功能强大的构造方式是 别名构造函数 ,它允许我们创建一个共享相同底层对象但是指向其内部不同数据成员或子对象的

    2024年01月16日
    浏览(44)
  • Python中的*args和**kwargs:无限可能的函数参数详解

      在 Python 编程中,*args 和 **kwargs 是常用的两个特殊参数,用于处理不确定数量的函数参数。它们提供了一种灵活的方式来传递和接收参数,使函数的定义更加通用。本文将详细介绍 *args 和 **kwargs 的使用方法,并提供相关代码示例。   args 是一个特殊的参数,在函数定义时

    2024年02月08日
    浏览(33)
  • pandas中的read_csv参数详解

    pandas. read_csv ( filepath_or_buffer , sep=NoDefault.no_default **,** delimiter=None **,** header=\\\'infer’ , names=NoDefault.no_default **,** index_col=None **,** usecols=None **,** squeeze=False **,** prefix=NoDefault.no_default **,** mangle_dupe_cols=True **,** dtype=None **,** engine=None **,** converters=None **,** true_values=None **,** false_values=N

    2024年02月03日
    浏览(37)
  • 利用Python进行数据清洗与预处理:Pandas的高级用法【第147篇—Pandas的高级用法】

    前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。【点击进入巨牛的人工智能学习网站】。 在数据科学和机器学习领域,数据清洗和预处理是至关重要的步骤。Pandas库作为Python中最受欢迎的数据处理工具之一,提供了强大的功能来处

    2024年04月09日
    浏览(104)
  • Python 之 Pandas 文件操作和读取 CSV 参数详解

    当使用 Pandas 做数据分析的时,需要读取事先准备好的数据集,这是做数据分析的第一步。Panda 提供了多种读取数据的方法,针对不同的文件格式,有以下几种: (1) read_csv() 用于读取文本文件。 (2) read_excel() 用于读取文本文件。 (3) read_json() 用于读取 json 文件。 (

    2024年02月15日
    浏览(48)
  • 【Python从入门到人工智能】14个必会的Python内置函数(6)——打印输出 (详细语法参考+参数说明+具体示例) | 详解Python中的打印输出!附综合案例!

      你有不伤别人的教养,却缺少一种不被别人伤害的气场,若没有人护你周全,就请你以后善良中带点锋芒,为自己保驾护航。   🎯作者主页: 追光者♂🔥          🌸个人简介:   💖[1] 计算机专业硕士研究生💖   🌟[2] 2022年度博客之星人工智能领域TOP4🌟   🏅[

    2024年02月15日
    浏览(58)
  • python利用pandas和csv包两种方式向一个csv文件写入或追加数据

    或者 一行加入一个数据

    2024年02月16日
    浏览(68)
  • Python Pandas to_csv函数

    `pandas` 库中的 `to_csv()` 方法用于将数据保存到 CSV(逗号分隔值)文件中。它是 `DataFrame` 对象的一个方法,可以将数据框中的内容写入到指定的文件中。 使用语法如下 : 其中一些常用参数说明如下: - `path_or_buf`:保存文件的路径或文件对象。如果不指定该参数,则返回一个

    2024年02月04日
    浏览(39)
  • Python Pandas中的append方法详解

    本文将详细介绍Python Pandas中的 append 方法,包括其原理、用法、示例(含结果输出)、源码分析和官方链接。 目录 原理 用法 示例(含结果输出) 源码分析 官方链接 原理 append 方法用于在Pandas DataFrame中追加行数据。它将另一个DataFrame、Series或类似字典的对象的数据添加到调

    2024年02月05日
    浏览(35)
  • Python-pandas:数据合并merge函数用法详解

    介绍一下数据分析中很常用的一个函数——merge,它能够进行高效的数据合并操作。先看一下语法格式及其初步解释: 生成的两个DataFrame对象如下: 1、参数left,right: 将df_d作为左侧的frame,df_e作为右侧的frame,则参数left=df_d,right=df_e; 2、参数how: 当参数how=\\\'left\\\':仅使用左

    2024年02月15日
    浏览(47)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包