pandas笔记

10月前作者：computer_vision_chen 分类：Toy博客阅读(35) 违法举报

这篇具有很好参考价值的文章主要介绍了pandas笔记。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

read_csv读取之后，会返回DataFrame格式的文件

读取去掉头的文件

import pandas as pd  
  
df = pd.read_csv('file.csv', header=None)

按列名读取某一列

pd['列名']

按索引读取n列

如读取前13列所有行的值

pd.iloc[:,:13]

忽略掉第一行，读取剩下所有行

原表格的第一行是统计的行数和列数，剩下的是空值，读取之后变成了 unnamed:
pandas笔记,python笔记,pandas,笔记使用如下代码去掉原文件的第一行

# 读取出来是dataframe格式的，忽略掉第一行，读取剩下所有行
boston = pd.read_csv('../data/boston_house_prices.csv',skiprows=[0])
print(type(boston))
boston

pandas笔记,python笔记,pandas,笔记文章来源地址https://www.toymoban.com/news/detail-717232.html

删除某列，并返回该列(带列头)

# 从dataframe格式的boston中，删除列为MEDV的列，并返回该列(带列头)
y = boston.pop('MEDV')

统计每一列的NaN和None这种空值

print(boston.isnull().sum())

热力图计算特征和特征之间的相关性

# 13个特征之间的相关性
import seaborn as sns
plt.figure(figsize=(12, 8))
# 第14列是标签，取前13列进行计算
sns.heatmap(boston.iloc[:,:13].corr(), annot=True, fmt='.2f', cmap='PuBu')
plt.show()

到了这里，关于pandas笔记的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

pandas笔记：groupby整理

按照Type 聚类，聚类后将同组的Kg属性合并，求均值聚合的内容可以是 max, min, mean, unique（唯一值）, nunique（唯一值数量），lambda 表达式按照Type 聚类，聚类后将同组的Kg、Depth属性合并，求均值重命名的名字=（需要操作的列名，需要的操作名）参考内容：

2024年02月16日
浏览(41)
pandas笔记

如读取前13列所有行的值原表格的第一行是统计的行数和列数，剩下的是空值，读取之后变成了 unnamed: 使用如下代码去掉原文件的第一行

2024年02月08日
浏览(35)
pandas 笔记：高亮内容

1.1.1 默认情况 1.1.2 color 调整高亮的颜色（后同） 1.1.3 subset 指定操作的列（后同） 1.1.4 props 突出显示的CSS属性（后同） subset color props 同1.1 2.1.1 axis 默认为0，表示列 axis=1，表示行 axis=None, dataFrame中最大的那个参数和使用方法和max一样 2.2.1 链式调用min和max 还是使用

2024年02月15日
浏览(38)
Matpoltlib && Pandas 学习笔记

目录 Matplotlib matplotlib常用方法散点图饼图直方图 Pandas pandas.Series(*args)参数说明 DataFrame 数据结构 CSV file 数据清洗 Matplotlib 定义： Matplotlib 是python的绘图库 Pyplot 是其子库，通用绘制2D图表， matplotlib常用方法散点图饼图直方图 Pandas 全称： \\\'panel data\\\' and \\\'python data analysis\\\'

2024年01月24日
浏览(37)
讲课笔记03：数据分析工具Pandas

2023年06月26日
浏览(127)
pandas笔记（一）-- 大的国家（逻辑索引、切片）

如果一个国家满足下述两个条件之一，则认为该国是大国：面积至少为 300 万平方公里人口至少为 2500 万编写解决方案找出大国的国家名称、人口和面积按任意顺序返回结果表，如下例所示输入： name continent area population gdp Afghanistan Asia 652230 25500100 20343000000 Albania Eur

2024年03月09日
浏览(45)
pandas 笔记：pivot_table 数据透视表

data DataFrame values 要进行聚合的列 index 在数据透视表索引（index）上进行分组的键 columns 在数据透视表列（column）上进行分组的键 agg_func 聚合方式 fill_value 缺省值的填充方式，默认为NAN margins 默认为False，设置为True之后，会计算一个总的value值 aggfunc默认按平均值聚合，values默

2024年02月17日
浏览(41)
模型预测笔记(四)：pandas_profiling生成数据报告

pandas_profiling是一个基于Python的开源库，用于生成数据分析报告。它可以自动分析数据集的各种统计指标，并生成一个详细的HTML报告，包括数据的基本信息、缺失值分析、唯一值分析、数值变量的描述统计、相关性分析、变量之间的交互等。 pandas_profiling的主要特点包括：自

2024年02月11日
浏览(33)
【头歌】——数据分析与实践-python-Pandas 初体验-Pandas数据取值与选择-Pandas进阶

第1关了解数据处理对象–Series 第2关了解数据处理对象-DataFrame 第3关读取 CSV 格式数据第4关数据的基本操作——排序第5关数据的基本操作——删除第6关数据的基本操作——算术运算第7关数据的基本操作——去重第8关数据重塑第1关 Series数据选择第2关 DataFrame数据

2024年01月22日
浏览(152)
python——pandas用法详解

目录一、pandas简介 1.1 pandas来源 1.2 pandas特点 1.3 pandas的两种主要数据结构二、 pandas数据结构详解 2.1 pandas——series 2.1.1 由字典创建一个series 2.1.2 由ndarray创建Series 2.1.3 由标量创建Series 2.1.4 Series特性 2.1.4.1 类ndarray 2.1.4.2 类dict（字典） 2.1.4.3 向量化操作(广播)和标签对齐 2.1

2024年02月09日
浏览(43)