如何统计DataFrame中各列数据分类的各个不同数据出现的次数

10月前作者：永远的12 分类：Toy博客阅读(77) 违法举报

这篇具有很好参考价值的文章主要介绍了如何统计DataFrame中各列数据分类的各个不同数据出现的次数。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

可以使用 value_counts 函数来统计每个不同数据在数据列中出现的次数。例如，假设有一个名为 df 的 DataFrame，其中包含一列名为 'col'。要统计 'col' 列中各个不同数据的出现次数，可以使用以下代码：

counts = df['col'].value_counts()

此代码将返回一个由各个数据和它们在 'col' 列中出现的次数组成的 Series。例如，假设 'col' 列包含以下数据：

0 1 1 2 2 2 3

那么，使用上述代码后，counts 将是一个包含以下内容的 Series：

2 3 2 1

其中，2 表示数字 2 在 'col' 列中出现了 1 次，3 表示数字 3 在 'col' 列中出现了 2 次，以此类推。

您还可以使用 value_counts 函数的 normalize 参数来获取各个数据在数据列中出现的频率，而不是出现的次数。例如，要获取各个数据在 'col' 列中出现的频率，可以使用以下代码：

frequencies = df['col'].value_counts(normalize=True)

这将返回一个由各个数据和它们在 'col' 列中出现的频率组成的 Series。例如，假设 'col' 列包含以下数据：文章来源地址https://www.toymoban.com/news/detail-451754.html

到了这里，关于如何统计DataFrame中各列数据分类的各个不同数据出现的次数的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

如何统计iOS产品不同渠道的下载量？

一、前言在开发过程中，Android可能会打出来很多的包，用于标识不同的商店下载量。原来觉得苹果只有一个商店：AppStore，如何做出不同来源的统计呢？本篇文章就是告诉大家如何做不同渠道来源统计。二、正文先看一下苹果自家统计到的数据：这个是在没有对下载链接做

2024年02月09日
浏览(39)
Pandas.DataFrame.groupby() 数据分组(数据透视、分类汇总) 详解含代码含测试数据集随Pandas版本持续更新

关于Pandas版本：本文基于 pandas2.2.0 编写。关于本文内容更新：随着pandas的stable版本更迭，本文持续更新，不断完善补充。传送门： Pandas API参考目录传送门： Pandas 版本更新及新特性传送门： Pandas 由浅入深系列教程 DataFrame.groupby() 方法用于使用映射器或指定的列，对 D

2024年01月16日
浏览(50)
数据结构基于不同方式词频统计和查找

实践题目：基于不同策略的英文单词的词频统计和检索系统、实验目的掌握基于顺序表的顺序查找、基于链表的顺序查找、折半查找）、二叉排序树和哈希表（包括基于开放地址法的哈希查找）实验内容一篇英文文章存储在一个文本文件中，然后分别基于线性表、

2024年02月12日
浏览(64)
[Python3]编写程序，对输入的英文字符串中各字母出现的次数进行统计(不区分大写字母和小写字母)，统计结果使用字典存放。例如，字符串“I have 2 ideas.“的统计结果为......

编写程序，对输入的英文字符串中各字母出现的次数进行统计(不区分大写字母和小写字母)，统计结果使用字典存放。例如，字符串\\\"I have 2 ideas.\\\"的统计结果为{\\\'i\\\':2, \\\'h\\\':1,\\\'a\\\':2, \\\'v\\\':1,\\\'e\\\':2, \\\'d\\\':1, \\\'s\\\':1}。注：用户输入的字符串中可能包含字母以外的其他字符。输入格式: 输入一个英

2024年02月04日
浏览(71)
不同分类器对数据的处理

2024年02月12日
浏览(43)
Pandas DataFrame如何添加一行数据?

在Pandas DataFrame中,我们经常需要添加新的行数据。这里介绍几种向DataFrame中添加一行数据的方法。 1. 使用.loc索引器 .loc索引器可以在DataFrame的尾部添加一条新行数据,语法如下: 例如: 2. 使用.append()方法 .append()方法可以向DataFrame尾部追加一行数据,语法如下: 例如: 3. 使用insert方

2024年02月12日
浏览(42)
Arcgis连续数据的分类（求不同值域的面积）

问题描述：如果得到的一个连续的影响数值数据，但是我们想求取某一段值域的面积占比，需要进行以下操作： 1.按照数值重分类，将某段数值变成一个类别 2.栅格转矢量，再求取面积

2024年02月12日
浏览(47)
C语言—统计一串字符中各个字符的出现频率

编写程序，能够统计某一段字符串中各个字符出现的次数。比如输入一串“abcade”，能够统计出其中各个字母的出现频率。这里实现思路比较巧妙，变量 i 用来做for循环的变量。 num[] 这个数组是给每一个ASIIC字符开辟的数组，通过 (int)str[i] 在遍历整个输入字符串str[]的同时，

2024年02月08日
浏览(41)
【机器学习案例】不同的模型算法对鸢尾花数据集进行分类

经典机器学习入门项目，使用逻辑回归、线性判别分析、KNN、分类与回归树、朴素贝叶斯、向量机、随机森林、梯度提升决策树对不同占比的训练集进行分类数据源：Iris Species | Kaggle 150行，5列，分三种鸢尾花类型，每种类型50个样本，每行数据包含花萼长度、花萼宽度、花

2024年02月04日
浏览(33)
mysql查询一周内的数据（起始日期为星期一）、根据一周不同星期进行分组统计

其中YEARWEEK ( time, 1) 获取的是时间的年以及是该年内的第几周，而其中的1则代表以星期一为一周的第一天。不加1的情况就是，获取的数据是以星期日为一周的第一天的，与我们的需求不符。直接在YEARWEEK ( now(), 1) 加上-1即是减一周，也就是上周。数字1则代表星期一，2代表

2024年02月13日
浏览(49)