Python 行列转换这几招真的很棒啊-Toy模板网

这篇具有很好参考价值的文章主要介绍了Python 行列转换这几招真的很棒啊。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

大家好,本文介绍的是 Pandas 中4个行列转换的方法，包含：

melt
转置T或者transpose
wide_to_long
explode（爆炸函数）

Pandas 行列转换

Python 行列转换这几招真的很棒啊

导入库

import pandas as pd  
import numpy as np

技术提升

本文由技术群粉丝分享，项目源码、数据、技术交流提升，均可加交流群获取，群友已超过2000人，添加时最好的备注方式为：来源+兴趣方向，方便找到志同道合的朋友

方式①、添加微信号：pythoner666，备注：来自CSDN
方式②、微信搜索公众号：Python学习与数据挖掘，后台回复：加群

函数melt

melt的主要参数：

pandas.melt(frame,   
            id_vars=None,   
            value_vars=None,   
            var_name=None,   
            value_name='value',  
            ignore_index=True,    
            col_level=None)

下面解释参数的含义：

frame：要处理的数据框DataFrame。
id_vars：表示不需要被转换的列名
value_vars：表示需要转换的列名，如果剩下的列全部都需要进行转换，则不必写
var_name和value_name：自定义设置对应的列名，相当于是取新的列名
igonore_index：是否忽略原列名，默认是True，就是忽略了原索引名，重新生成0,1,2,3,4…的自然索引
col_level：如果列是多层索引列MultiIndex，则使用此参数；这个参数少用

模拟数据

# 待转换的数据：frame  
df = pd.DataFrame({"col1":[1,1,1,1,1],  
                   "col2":[3,3,3,3,3],  
                   "col3":["a","a","a","b","b"]  
                  })  
df

Python 行列转换这几招真的很棒啊

id_vars

Python 行列转换这几招真的很棒啊

value_vars

Python 行列转换这几招真的很棒啊

上面两个参数的同时使用：

Python 行列转换这几招真的很棒啊

同时转换多个列属性：

Python 行列转换这几招真的很棒啊

var_name和value_name

pd.melt(  
    df,  
    id_vars=["col1"],  # 不变  
    value_vars=["col3"],  # 转变  
    var_name="col4",  # 新的列名  
    value_name="col5" # 对应值的新列名  
)

Python 行列转换这几招真的很棒啊

ignore_index

默认情况下是生成自然索引：

Python 行列转换这几招真的很棒啊

可以改成False，使用原来的索引：

Python 行列转换这几招真的很棒啊

转置函数

pandas中的T属性或者transpose函数就是实现行转列的功能，准确地说就是转置

简单转置

模拟了一份数据，查看转置的结果：

Python 行列转换这几招真的很棒啊

使用transpose函数进行转置：

Python 行列转换这几招真的很棒啊

还有另一个方法：先对值values进行转置，再把索引和列名进行交换：

Python 行列转换这几招真的很棒啊

最后看一个简单的案例：

Python 行列转换这几招真的很棒啊

wide_to_long函数

字面意思就是：将数据集从宽格式转换为长格式

wide_to_long(  
    df,  
    stubnames,  
    i,  
    j,  
    sep: str = "",  
    suffix: str = "\\d+"

参数的具体解释：

df：待转换的数据框
stubnames：宽表中列名相同的存根部分
i：要用作 id 变量的列
j：给长格式的“后缀”列设置 columns
sep：设置要删除的分隔符。例如 columns 为 A-2020，则指定 sep=‘-’ 来删除分隔符。默认为空。
suffix：通过设置正则表达式取得“后缀”。默认’\d+‘表示取得数字后缀。没有数字的“后缀”可以用’\D+'来取得

模拟数据

Python 行列转换这几招真的很棒啊

转换过程

使用函数实施转换：

Python 行列转换这几招真的很棒啊

设置多层索引

先模拟一份数据：

Python 行列转换这几招真的很棒啊

如果不习惯多层索引，可以转成下面的格式：

Python 行列转换这几招真的很棒啊

sep和suffix

df5 = pd.DataFrame({  
    'a': [1, 1, 2, 2, 3, 3, 3],  
    'b': [1, 2, 2, 3, 1, 2, 3],  
    'stu_one': [2.8, 2.9, 1.8, 1.9, 2.2, 2.3, 2.1],  
    'stu_two': [3.4, 3.8, 2.8, 2.4, 3.3, 3.4, 2.9]  
})  
df5

Python 行列转换这几招真的很棒啊

pd.wide_to_long(  
    df5,   
    stubnames='stu',   
    i=['a', 'b'],   
    j='number',  
    sep='_', # 列名中存在连接符时使用；默认为空  
    suffix=r'\w+')  # 基于正则表达式的后缀；默认是数字\d+；这里改成\w+，表示字母

Python 行列转换这几招真的很棒啊

爆炸函数-explode

explode(column, ignore_index=False)

这个函数的参数就只有两个：

column：待爆炸的元素
ignore_index：是否忽略索引；默认是False，保持原来的索引

模拟数据

Python 行列转换这几招真的很棒啊

单个字段爆炸

对单个字段实施爆炸过程，将宽表转成长表：

Python 行列转换这几招真的很棒啊

参数ignore_index

Python 行列转换这几招真的很棒啊

多个字段爆炸

连续对多个字段实施爆炸的过程：

Python 行列转换这几招真的很棒啊

读者解疑

在这里回答一个读者的问题，数据采用模拟的形式。有下面的这样一份数据，需求：

每个shop下每个fruit在各自shop的占比

fruit = pd.DataFrame({  
    "shop":["shop1","shop3","shop2","shop3",  
            "shop2","shop1","shop3","shop2",  
            "shop3","shop2","shop3","shop2","shop1"],  
    "fruit":["苹果","葡萄","香蕉","苹果",  
             "葡萄","橘子","梨","哈密瓜",  
             "葡萄","香蕉","苹果","葡萄","橘子"],  
    "number":[100,200,340,150,  
              200,300,90,80,340,  
              150,200,300,90]})  
fruit