pandas笔记

这篇具有很好参考价值的文章主要介绍了pandas笔记。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

read_csv读取之后,会返回DataFrame格式的文件

读取去掉头的文件

import pandas as pd  
  
df = pd.read_csv('file.csv', header=None)

按列名读取某一列

pd['列名']

按索引读取n列

如读取前13列所有行的值

pd.iloc[:,:13]

忽略掉第一行,读取剩下所有行

原表格的第一行是统计的行数和列数,剩下的是空值,读取之后变成了 unnamed:
pandas笔记,python笔记,pandas,笔记使用如下代码去掉原文件的第一行

# 读取出来是dataframe格式的,忽略掉第一行,读取剩下所有行
boston = pd.read_csv('../data/boston_house_prices.csv',skiprows=[0])
print(type(boston))
boston

pandas笔记,python笔记,pandas,笔记文章来源地址https://www.toymoban.com/news/detail-717232.html

删除某列,并返回该列(带列头)

# 从dataframe格式的boston中,删除列为MEDV的列,并返回该列(带列头)
y = boston.pop('MEDV')

统计每一列的NaN和None这种空值

print(boston.isnull().sum())

热力图计算特征和特征之间的相关性

# 13个特征之间的相关性
import seaborn as sns
plt.figure(figsize=(12, 8))
# 第14列是标签,取前13列进行计算
sns.heatmap(boston.iloc[:,:13].corr(), annot=True, fmt='.2f', cmap='PuBu')
plt.show()

到了这里,关于pandas笔记的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • pandas笔记

    如读取前13列所有行的值 原表格的第一行是统计的行数和列数,剩下的是空值,读取之后变成了 unnamed: 使用如下代码去掉原文件的第一行

    2024年02月08日
    浏览(33)
  • pandas 笔记:高亮内容

     1.1.1 默认情况 1.1.2  color 调整高亮的颜色(后同)  1.1.3 subset 指定操作的列(后同) 1.1.4 props  突出显示的CSS属性(后同)   subset color props 同1.1 2.1.1 axis 默认为0,表示列 axis=1,表示行  axis=None, dataFrame中最大的那个 参数和使用方法和max一样 2.2.1 链式调用min和max 还是使用

    2024年02月15日
    浏览(36)
  • pandas笔记:groupby整理

    按照Type 聚类,聚类后将同组的Kg属性合并,求均值 聚合的内容可以是 max, min, mean, unique(唯一值), nunique(唯一值数量),lambda 表达式       按照Type 聚类,聚类后将同组的Kg、Depth属性合并,求均值   重命名的名字=(需要操作的列名,需要的操作名)       参考内容:

    2024年02月16日
    浏览(40)
  • Matpoltlib && Pandas 学习笔记

    目录 Matplotlib matplotlib常用方法 散点图 饼图 直方图 Pandas pandas.Series(*args)参数说明 DataFrame 数据结构 CSV file 数据清洗 Matplotlib 定义: Matplotlib 是python的绘图库 Pyplot 是其子库,通用绘制2D图表, matplotlib常用方法 散点图 饼图 直方图 Pandas 全称: \\\'panel data\\\' and \\\'python data analysis\\\'

    2024年01月24日
    浏览(34)
  • 讲课笔记03:数据分析工具Pandas

    2023年06月26日
    浏览(125)
  • pandas笔记(一)-- 大的国家(逻辑索引、切片)

    如果一个国家满足下述两个条件之一,则认为该国是 大国 : 面积至少为 300 万平方公里 人口至少为 2500 万 编写解决方案找出 大国 的国家名称、人口和面积 按 任意顺序 返回结果表,如下例所示 输入: name continent area population gdp Afghanistan Asia 652230 25500100 20343000000 Albania Eur

    2024年03月09日
    浏览(43)
  • pandas 笔记:pivot_table 数据透视表

    data DataFrame values 要进行聚合的列 index 在数据透视表索引(index)上进行分组的键 columns 在数据透视表列(column)上进行分组的键 agg_func 聚合方式 fill_value 缺省值的填充方式,默认为NAN margins 默认为False,设置为True之后,会计算一个总的value值 aggfunc默认按平均值聚合,values默

    2024年02月17日
    浏览(39)
  • 模型预测笔记(四):pandas_profiling生成数据报告

    pandas_profiling是一个基于Python的开源库,用于生成数据分析报告。它可以自动分析数据集的各种统计指标,并生成一个详细的HTML报告,包括数据的基本信息、缺失值分析、唯一值分析、数值变量的描述统计、相关性分析、变量之间的交互等。 pandas_profiling的主要特点包括: 自

    2024年02月11日
    浏览(30)
  • 【头歌】——数据分析与实践-python-Pandas 初体验-Pandas数据取值与选择-Pandas进阶

    第1关 了解数据处理对象–Series 第2关 了解数据处理对象-DataFrame 第3关 读取 CSV 格式数据 第4关 数据的基本操作——排序 第5关 数据的基本操作——删除 第6关 数据的基本操作——算术运算 第7关 数据的基本操作——去重 第8关 数据重塑 第1关 Series数据选择 第2关 DataFrame数据

    2024年01月22日
    浏览(136)
  • Python安装Pandas库

    方法一:cmd命令行执行pip install pandas 1.Windows+R,输入cmd打开命令行窗口,输入pip install pandas。 如下图所示 2.若出现下图所示的告警,说明版本有冲突。 按照提示输入pip install --upgrade pip,对pip进行升级 3.若出现下图所示的升级报错,输入python -m ensurepip,python -m pip install --up

    2024年02月03日
    浏览(53)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包