最近接触到数据科学,需要对一些数据表进行分析,观察到代码中一会出现loc一会又出现iloc,下面对两者的用法给出我的一些理解。
1.联系
(1)操作对象相同:loc和iloc都是对DataFrame类型进行操作;
(2)完成目的相同:二者都是用于选取DataFrame中对应行或列中的元素。
2.区别
loc和iloc索引的行列标签类型不同。
iloc使用顺序数字来索引数据,而不能使用字符型的标签来索引数据;注意:这里的顺序数字是指从0开始计数!
loc使用实际设置的索引来索引数据。但行列名为数字时,loc也可以索引数字,但这里的数字不一定从0开始编号,是对应具体行列名的数字!
3.用法
下面用代码来讲解两者的用法。
3.1行列全为从0开始顺序编号
import pandas as pd
import numpy as np
a = np.arange(12).reshape(3,4)
#将a转化为DataFrame类型
df = pd.DataFrame(a)
#展示df
df
由于未给df的行列命名,默认从0开始编号,所以这个时候使用loc和iloc结果是一样的。
索引为一个数,默认输出行
print(df.loc[0])#输出第0行元素
print(df.iloc[0])#输出第0行元素
两者输出结果都为:
0 0 1 1 2 2 3 3 Name: 0, dtype: int32
输出结果为df第0行元素,结果中第一列表示列名,第二列表示具体的值。如果只需要输出某一列,输入df.loc[:,0]表示输出第0列。
如果需要输出第0到2列的数据。
#方式1
df.loc[:,0:2]#可把loc理解为遍历字符串类型,0:2则表示标签为0,1,2三列
#方式2
df.iloc[:,0:3]#iloc遍历的数数字,python中0:3对应0,1,和2
输出结果均为:
3.2有一行或列不是从0顺序编号
#把行标签换成其他数字编号
df.index=[2,5,7]
df.loc[2]
此时df变为:
输出结果为:
0 0 1 1 2 2 3 3 Name: 2, dtype: int32
输出结果对应的是列标签为“2”所在的行。
我们继续用df.iloc[2]输出结果:
0 8 1 9 2 10 3 11 Name: 7, dtype: int32
可见输出的是第2行的数据。
在这里我们能大概对loc和iloc的用法有了一定的了解。
3.3行或者列为非数字标签
#把行标签转化为非数字类型
df.index=['a','b','c']
#输出第a、b行,第0到2列的数据
#方式1
df.loc[['a','b'],0:2]#可把loc理解为遍历字符串类型,0:2则表示标签为0,1,2三列
#方式2
df.iloc[0:2,0:3]#iloc遍历的是数字,0:2表示的是0和1,0:3表示0,1,2。
两者输出结果均为:
3.4 其他用法
一般情况下,表的行为从0编号的数字类型,列为具体的字符串类型。行的数字容易确定,列的列名容易确定。
#将行换成0 1 2编号
df.index=[0,1,2]
#列标签换成A B C D
df.columns=['A','B','C','D']
df.iloc[1]['A']#实现输出第1行第A列的数据
输出结果为4。
如果要输出第1行,第AB列,使用df.iloc[1][['A','B']],这里一定要注意'A','B'是作为一个列表输入的,右侧一共有两个中括号。
输出结果:文章来源:https://www.toymoban.com/news/detail-404126.html
A 4 B 5 Name: 1, dtype: int32
df.iloc[1][['A','B']]等价于df.iloc[1,0:2],但是很多情况下我们不知道具体列名对应的数字,所以采用第一种方法可以提高编程效率。文章来源地址https://www.toymoban.com/news/detail-404126.html
到了这里,关于Python学习.iloc和.loc区别、联系与用法的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!