pandas笔记

这篇具有很好参考价值的文章主要介绍了pandas笔记。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

read_csv读取之后,会返回DataFrame格式的文件

读取去掉头的文件

import pandas as pd  
  
df = pd.read_csv('file.csv', header=None)

按列名读取某一列

pd['列名']

按索引读取n列

如读取前13列所有行的值

pd.iloc[:,:13]

忽略掉第一行,读取剩下所有行

原表格的第一行是统计的行数和列数,剩下的是空值,读取之后变成了 unnamed:
pandas笔记,python笔记,pandas,笔记使用如下代码去掉原文件的第一行

# 读取出来是dataframe格式的,忽略掉第一行,读取剩下所有行
boston = pd.read_csv('../data/boston_house_prices.csv',skiprows=[0])
print(type(boston))
boston

pandas笔记,python笔记,pandas,笔记文章来源地址https://www.toymoban.com/news/detail-717232.html

删除某列,并返回该列(带列头)

# 从dataframe格式的boston中,删除列为MEDV的列,并返回该列(带列头)
y = boston.pop('MEDV')

统计每一列的NaN和None这种空值

print(boston.isnull().sum())

热力图计算特征和特征之间的相关性

# 13个特征之间的相关性
import seaborn as sns
plt.figure(figsize=(12, 8))
# 第14列是标签,取前13列进行计算
sns.heatmap(boston.iloc[:,:13].corr(), annot=True, fmt='.2f', cmap='PuBu')
plt.show()

到了这里,关于pandas笔记的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • pandas笔记:groupby整理

    按照Type 聚类,聚类后将同组的Kg属性合并,求均值 聚合的内容可以是 max, min, mean, unique(唯一值), nunique(唯一值数量),lambda 表达式       按照Type 聚类,聚类后将同组的Kg、Depth属性合并,求均值   重命名的名字=(需要操作的列名,需要的操作名)       参考内容:

    2024年02月16日
    浏览(41)
  • pandas笔记

    如读取前13列所有行的值 原表格的第一行是统计的行数和列数,剩下的是空值,读取之后变成了 unnamed: 使用如下代码去掉原文件的第一行

    2024年02月08日
    浏览(35)
  • pandas 笔记:高亮内容

     1.1.1 默认情况 1.1.2  color 调整高亮的颜色(后同)  1.1.3 subset 指定操作的列(后同) 1.1.4 props  突出显示的CSS属性(后同)   subset color props 同1.1 2.1.1 axis 默认为0,表示列 axis=1,表示行  axis=None, dataFrame中最大的那个 参数和使用方法和max一样 2.2.1 链式调用min和max 还是使用

    2024年02月15日
    浏览(38)
  • Matpoltlib && Pandas 学习笔记

    目录 Matplotlib matplotlib常用方法 散点图 饼图 直方图 Pandas pandas.Series(*args)参数说明 DataFrame 数据结构 CSV file 数据清洗 Matplotlib 定义: Matplotlib 是python的绘图库 Pyplot 是其子库,通用绘制2D图表, matplotlib常用方法 散点图 饼图 直方图 Pandas 全称: \\\'panel data\\\' and \\\'python data analysis\\\'

    2024年01月24日
    浏览(37)
  • 讲课笔记03:数据分析工具Pandas

    2023年06月26日
    浏览(127)
  • pandas笔记(一)-- 大的国家(逻辑索引、切片)

    如果一个国家满足下述两个条件之一,则认为该国是 大国 : 面积至少为 300 万平方公里 人口至少为 2500 万 编写解决方案找出 大国 的国家名称、人口和面积 按 任意顺序 返回结果表,如下例所示 输入: name continent area population gdp Afghanistan Asia 652230 25500100 20343000000 Albania Eur

    2024年03月09日
    浏览(45)
  • pandas 笔记:pivot_table 数据透视表

    data DataFrame values 要进行聚合的列 index 在数据透视表索引(index)上进行分组的键 columns 在数据透视表列(column)上进行分组的键 agg_func 聚合方式 fill_value 缺省值的填充方式,默认为NAN margins 默认为False,设置为True之后,会计算一个总的value值 aggfunc默认按平均值聚合,values默

    2024年02月17日
    浏览(41)
  • 模型预测笔记(四):pandas_profiling生成数据报告

    pandas_profiling是一个基于Python的开源库,用于生成数据分析报告。它可以自动分析数据集的各种统计指标,并生成一个详细的HTML报告,包括数据的基本信息、缺失值分析、唯一值分析、数值变量的描述统计、相关性分析、变量之间的交互等。 pandas_profiling的主要特点包括: 自

    2024年02月11日
    浏览(33)
  • 【头歌】——数据分析与实践-python-Pandas 初体验-Pandas数据取值与选择-Pandas进阶

    第1关 了解数据处理对象–Series 第2关 了解数据处理对象-DataFrame 第3关 读取 CSV 格式数据 第4关 数据的基本操作——排序 第5关 数据的基本操作——删除 第6关 数据的基本操作——算术运算 第7关 数据的基本操作——去重 第8关 数据重塑 第1关 Series数据选择 第2关 DataFrame数据

    2024年01月22日
    浏览(152)
  • python——pandas用法详解

    目录 一、pandas简介 1.1 pandas来源 1.2 pandas特点 1.3 pandas的两种主要数据结构 二、 pandas数据结构详解 2.1 pandas——series 2.1.1 由字典创建一个series 2.1.2 由ndarray创建Series 2.1.3 由标量创建Series 2.1.4 Series特性 2.1.4.1 类ndarray 2.1.4.2 类dict(字典) 2.1.4.3 向量化操作(广播)和标签对齐 2.1

    2024年02月09日
    浏览(43)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包