【数据分析 - 基础入门之pandas篇②】- pandas数据结构——Series

这篇具有很好参考价值的文章主要介绍了【数据分析 - 基础入门之pandas篇②】- pandas数据结构——Series。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

前言

大家好！我是一朵向阳花（花花花），本期跟大家分享的知识是 pandas 数据结构——Series。

作者的【 Python 数据分析】专栏正在火热更新中，如果本文对您有帮助，欢迎大家点赞 + 评论 + 收藏！

每日金句分享：愿你有一天，能和你最重要的人重逢。』—— 艾拉「可塑性记忆」。

一、Series的创建

Series 是一种类似于一维数组的对象，由下面两部分组成：

values：一组数据，ndarray 类型

index：数据索引

顾名思义，我们在创建 Series 对象时，需要传递一组数据，该数据大多数时候是可迭代对象。因此，下面三种创建方式都是将数据传入到 Series 方法中。

1.1 列表创建

list1 = list('ABCD') # 创建列表
s =pd.Series(list1) # 传递列表数据到 Series 方法中
print(s)
print(type(s.values))
print(type(s.index))

【数据分析 - 基础入门之pandas篇②】- pandas数据结构——Series,Python数据分析,数据分析,pandas,数据结构

1.2 NumPy数组创建

n = np.array(range(5,10))
s2 = pd.Series(n)
s2

【数据分析 - 基础入门之pandas篇②】- pandas数据结构——Series,Python数据分析,数据分析,pandas,数据结构

1.3 字典创建

前两种方式，都是只传递了数据，那么索引是默认索引（0 ~ N-1）；下面的字典创建方式，则是以字典的键为索引，字典的值为数据。

d = {
'a':11,'b':22,'c':33,'d':44
}
s = pd.Series(d)
s

【数据分析 - 基础入门之pandas篇②】- pandas数据结构——Series,Python数据分析,数据分析,pandas,数据结构

二、Series索引

从以上 Series 的创建中我们可以看出，Series 的索引是可以修改的 。我们先来探讨以下索引的作用。

获取元素

有多种获取方式，s.索引名，s[‘索引名’]，s.loc[‘索引名’]

允许修改

（为 s.index 重新赋值即可，注意前后数量一致）

显式即表示使用索引名称的方式，隐式即表示使用序号的方式。后面的显式切片和隐式切片也是同理。

2.1 显式索引

取单个值时，三种方式：（假设 Series 对象名为 s）

s.索引名（数字索引不能用这种方式）

s[‘索引名’]

s.loc[‘索引名’]

取多个值时，返回一个新的 Series 对象，两种方式（也就是加中括号）：

s.[[‘索引名1’,‘索引名2’]]

s.loc[[‘索引名1’,‘索引名2’]]

s = pd.Series(np.array(range(5,10)),index=list('abcde'),name='number')
print(s)
display(s.a,s['a'],s.loc['a'])

【数据分析 - 基础入门之pandas篇②】- pandas数据结构——Series,Python数据分析,数据分析,pandas,数据结构

2.2 隐式索引

隐式索引和显示索引的区别就是它通过数字来获取值。因为是数字，因此 s.number 这种方式肯定 不能用了 ，其他都相同。

取单值，两种方式：

s[number]

s.iloc[number]

取多值，两种方式：

s[[number1,number2]]

s.iloc[[number1,number2]]

s = pd.Series(np.array(range(5,10)),index=list('abcde'),name='number')
print(s)
print('取单值')
print(s[1])
print(s.iloc[1])
print('取多值')
print(s[[1,2]])
print(s.iloc[[1,2]])

【数据分析 - 基础入门之pandas篇②】- pandas数据结构——Series,Python数据分析,数据分析,pandas,数据结构

三、Series切片

切片操作是获取一个新的 Series 对象的操作，显式切片是为左闭右臂，隐式切片时为左闭右开。

2.1 显式切片

两种方式：

s[索引名1：索引名2]

s.loc[索引名1：索引名2]

2.2 隐式切片

两种方式：

s[number1：number2]

s.iloc[number1：number2]

s = pd.Series({
'yw':100,
'math':150,
'eng':110,
'Python':130
})
print('数据：',end='')
print('-'*10)
print(s)
print('-'*10)
print('显式切片')
print(s['yw':'math'])
print('-'*10)
print(s.loc['yw':'math'])
print('-'*10)
print('隐式切片')
print(s[0:1])
print('-'*10)
print(s.iloc[0:1])

【数据分析 - 基础入门之pandas篇②】- pandas数据结构——Series,Python数据分析,数据分析,pandas,数据结构

四、Series基本属性和方法

Series基本属性和方法是让我们更好了解数据组成的手段。

4.1 属性

属性	作用
s.shape	查看数据行列
s.ndim	查看维度，Series 就是一维，ndim 恒等于1
s.size	查看数据总数
s.index	查看索引
s.values	查看数据
s.name	查看 Series 对象的 name，若未设定则为空

4.2 方法

方法	功能
s.head()	查看前5条数据，若传入数字 n ，则查看前 n 条
s.tail()	查看后5条数据，若传入数字 n ，则查看后 n 条
s.isnull()	判断数据是否为空，空的为 True ，不空的为 False
s.notnull()	判断数据是否不空，空的为 False ，不空的为 True

4.3 案例——使用 bool 值去除空值

原理：Series 切片可以再传入一个 Series 对象，该 Series 对象索引要和原来相同，那么值为 False 的将不会被取出。

请看示例：

s = pd.Series(['a','e','f','b'])
s[pd.Series([True,True,False,True])]

【数据分析 - 基础入门之pandas篇②】- pandas数据结构——Series,Python数据分析,数据分析,pandas,数据结构
如果改为：

s = pd.Series(['a','e','f','b'])
s[pd.Series([True,True,False,True],index=list('abcd'))]

那么将会报错：

【数据分析 - 基础入门之pandas篇②】- pandas数据结构——Series,Python数据分析,数据分析,pandas,数据结构

下面是 Series 去除空值的案例。

s = pd.Series(['zhangsan','lisi','a',np.NAN,None])
print('数据：'+'-'*10)
print(s)
conditon = s.isnull()
print('判空情况：'+'-'*10)
print(conditon)
# 使用 bool 值索引过滤数据
s = s[~conditon]
print('过滤结果：'+'-'*10)
print(s)

【数据分析 - 基础入门之pandas篇②】- pandas数据结构——Series,Python数据分析,数据分析,pandas,数据结构

五、Series运算

Series 运算包括算术运算和 Series 对象之间运算。算术运算是针对每一个元素的，有 +、-、*、/、 //、 %、 ** 等，这里不再赘述。Series 对象间的运算，只要记住，索引一个有一个没有时，计算值为 NaN，其他按照算术运算计算即可。

算术运算

s = pd.Series(np.array(range(5,10)))
print(s)
s * 10

【数据分析 - 基础入门之pandas篇②】- pandas数据结构——Series,Python数据分析,数据分析,pandas,数据结构

Series对象间的运算

s1 = pd.Series(np.array(range(5,10)))
s2 = pd.Series([3,6,10,12])
print(s1)
print(s2)
s1 + s2 # 索引一个有一个没有时，计算值为 NaN

【数据分析 - 基础入门之pandas篇②】- pandas数据结构——Series,Python数据分析,数据分析,pandas,数据结构

六、Series多层行索引

6.1 Series多层索引的构建

Series 不仅支持单层索引，还支持多层索引。最简单的实现方式就是将 index 设置成多维。

下面以二级行索引为例：

s = pd.Series(np.random.randint(60,100,6),index=[['语文','语文','语文','数学','数学','数学'],['小明','小红','小丽','小明','小红','小丽']])
print(s)

【数据分析 - 基础入门之pandas篇②】- pandas数据结构——Series,Python数据分析,数据分析,pandas,数据结构

6.2 Series多层索引的索引和切片操作

对于 Series 多层索引的索引和切片操作，只要记住以下两点：

要先取第一层，再取第二层，不能直接取第二层索引

获取到第一层之后，就是一个普通的单层索引 Series

隐式索引，直接得到数

具体的方式，还是索引和切片都分为显式和隐式，下面通过一个案例来演示。

索引：

s = pd.Series(np.random.randint(60,100,6),index=[['语文','语文','语文','数学','数学','数学'],['小明','小红','小丽','小明','小红','小丽']])
print(s)
# 索引
print('显式索引：'+'-'*10)
print(s['语文']) # 获取到单层 Series
print(s.loc['语文']) 
print(s['语文']['小明'],s.loc['语文']['小明']) # 获取到单个值
print('隐式索引：'+'-'*10)
print(s.iloc[0])
print(s[0]) # 获取到单个值

【数据分析 - 基础入门之pandas篇②】- pandas数据结构——Series,Python数据分析,数据分析,pandas,数据结构

切片：

s = pd.Series(np.random.randint(60,100,6),index=[['语文','语文','语文','数学','数学','数学'],['小明','小红','小丽','小明','小红','小丽']])
s = s.sort_index()
print(s)
print('显式切片'+'-'*10)
print(s['数学':'语文'])
print(s.loc['数学':'语文'])
print('隐式切片'+'-'*10)
print(s[0:2])
print(s.iloc[0:2])

【数据分析 - 基础入门之pandas篇②】- pandas数据结构——Series,Python数据分析,数据分析,pandas,数据结构

结语

💕 本期跟大家分享的 “芝士” 就到此结束了，关于 Series 数据结构，你学会了吗？✨

🍻 我是向阳花花花花，在学习的路上一直前行，期待与你一起进步。~ 🍻

🔥如果文中有些地方不清楚的话，欢迎联系我，我会给大家提供思路及解答。🔥文章来源地址https://www.toymoban.com/news/detail-548358.html

文章直达	链接
上期回顾	【数据分析 - 基础入门之pandas篇①】- pandas介绍
下期预告	【数据分析 - 基础入门之pandas篇③】- pandas数据结构——DataFrame

Toy模板网

【数据分析 - 基础入门之pandas篇②】- pandas数据结构——Series

前言

一、Series的创建

1.1 列表创建

1.2 NumPy数组创建

1.3 字典创建

二、Series索引

2.1 显式索引

2.2 隐式索引

三、Series切片

2.1 显式切片

2.2 隐式切片

四、Series基本属性和方法

4.1 属性

4.2 方法

4.3 案例——使用 bool 值去除空值

五、Series运算

六、Series多层行索引

6.1 Series多层索引的构建

6.2 Series多层索引的索引和切片操作

结语

相关导读

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

支付宝扫一扫领取红包，优惠每天领

二维码1

二维码2

【数据分析 - 基础入门之pandas篇②】- pandas数据结构——Series

前言

一、Series的创建

1.1 列表创建

1.2 NumPy数组创建

1.3 字典创建

二、Series索引

2.1 显式索引

2.2 隐式索引

三、Series切片

2.1 显式切片

2.2 隐式切片

四、Series基本属性和方法

4.1 属性

4.2 方法

4.3 案例——使用 bool 值去除空值

五、Series运算

六、Series多层行索引

6.1 Series多层索引的构建

6.2 Series多层索引的索引和切片操作

结语

相关导读

相关文章

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

支付宝扫一扫领取红包，优惠每天领

二维码1

二维码2