郭炜老师mooc第十一章数据分析和展示(numpy,pandas, matplotlib)

这篇具有很好参考价值的文章主要介绍了郭炜老师mooc第十一章数据分析和展示(numpy,pandas, matplotlib)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

多维数组库numpy

郭炜老师mooc第十一章数据分析和展示(numpy,pandas, matplotlib),Python基础知识,数据分析,数据挖掘

numpy创建数组的常用函数

郭炜老师mooc第十一章数据分析和展示(numpy,pandas, matplotlib),Python基础知识,数据分析,数据挖掘

# numpy数组

import numpy as np #以后numpy简写为np
print(np.array([1,2,3])) #>>[1 2 3]
print(np.arange(1,9,2)) #>>[1 3 5 7] 不包括9
print(np.linspace(1,10,4)) #>>[ 1. 4. 7. 10.]
# linespace(x,y,n),创建一个由区间[x,y]的n-1等分点构成的一维数组,包含x和y

print(np.random.randint(10,20,[2,3]))
#>>[[12 19 12]
#>> [19 13 10]]

print(np.random.randint(10,20,5)) #>>[12 19 19 10 13]
a = np.zeros(3)
print(a) #>>[ 0. 0. 0.]
print(list(a)) #>>[0.0, 0.0, 0.0] 
# 列表每个元素之间有一个逗号隔开

a = np.zeros((2,3),dtype=int) #创建一个2行3列的元素都是整数0的数组
print(a)

 numpy数组常用属性和函数

郭炜老师mooc第十一章数据分析和展示(numpy,pandas, matplotlib),Python基础知识,数据分析,数据挖掘

# numpy数组常用属性和函数

import numpy as np
b = np.array([i for i in range(12)])
#b是[ 0 1 2 3 4 5 6 7 8 9 10 11]
print(b)

a = b.reshape((3,4)) #转换成3行4列的数组,b不变
print(len(a)) #>>3 a有3行
print(a.size) #>>12 a的元素个数是12
print(a.ndim) #>>2 a是2维的
print(a.shape) #>>(3, 4) a是3行4列
print(a.dtype) #>>int32 a的元素类型是32位的整数
L = a.tolist() #转换成列表,a不变
print(L)
#>>[[0, 1, 2, 3], [4, 5, 6, 7], [8, 9, 10, 11]]
b = a.flatten() #转换成一维数组
print(b) #>>[ 0 1 2 3 4 5 6 7 8 9 10 11 ]

 numpy数组元素的增删

郭炜老师mooc第十一章数据分析和展示(numpy,pandas, matplotlib),Python基础知识,数据分析,数据挖掘

# numpy添加数组元素

import numpy as np
a = np.array((1,2,3)) #a是[1 2 3]
b = np.append(a,10) #a不会发生变化
print(a)
print(b) #>>[ 1 2 3 10]
print(np.append(a,[10,20])) #>>[ 1 2 3 10 20]
c = np.zeros((2,3),dtype=int) #c是2行3列的全0数组
print(np.append(a,c)) #>>[1 2 3 0 0 0 0 0 0]
print(np.concatenate((a,[10,20],a)))
#>>[ 1 2 3 10 20 1 2 3]
print(np.concatenate((c,np.array([[10,20,30]]))))
#c拼接一行[10,20,30]得新数组
print(np.concatenate((c,np.array([[1,2],[10,20]])),axis=1))
#c的第0行拼接了1,2两个元素、第1行拼接了10,20两个新元素后得到新数素
# numpy删除数组元素

import numpy as np
a = np.array((1,2,3,4))
b = np.delete(a,1) #删除a中下标为1的元素,a不会改变
print(b) #>>[1 3 4]
b = np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12]])
print("b删除前:\n",b,"\nb删除后:")

print("按行删除:\n", np.delete(b,1,axis=0)) #删除b的第1行得新数组

print("按列删除:\n", np.delete(b,1,axis=1)) #删除b的第1行得新数组

#>>[[ 1 2 3 4]
#>> [ 9 10 11 12]]
print(np.delete(b,1,axis=1)) #删除b的第1列得新数组
print(np.delete(b,[1,2],axis=0)) #删除b的第1行和第2行得新数组
print(np.delete(b,[1,3],axis=1)) #删除b的第1列和第3列得新数组

在numpy数组中查找元素 

  • np.argwhere( a ):返回非0的数组元组的索引,其中a是要索引数组的条件。
  • np.where(condition) 当where内只有一个参数时,那个参数表示条件,当条件成立时,           where返回的是每个符合condition条件元素的坐标,返回的是以元组的形式。
# 在numpy数组中查找元素

import numpy as np
a = np.array((1,2,3,5,3,4))
print("a: ", a)

pos = np.argwhere(a==3) #pos是[[2] [4]]
print(pos)
# np.argwhere( a ):返回非0的数组元组的索引,其中a是要索引数组的条件。

a = np.array([[1,2,3],[4,5,2]])
print(2 in a) #>>True
pos = np.argwhere(a==2) #pos是[[0 1] [1 2]]
print(pos)

b = a[a>2] #抽取a中大于2的元素形成一个一维数组
print(b) #>>[3 4 5]
a[a > 2] = -1 #a变成[[ 1 2 -1] [-1 -1 2]]
print(a)

numpy数组的切片

 numpy数组的切片是“视图”,是原数组的一部分,而非一部分的拷贝

# numpy数组的切片是“视图”,是原数组的一部分,而非一部分的拷贝

import numpy as np
a = np.arange(8) #a是[0 1 2 3 4 5 6 7]
b = a[3:6] #注意,b是a的一部分
print(b) #>>[3 4 5]
c = np.copy(a[3:6]) #c是a的一部分的拷贝
b[0] = 100 #会修改a
print(a) #>>[ 0 1 2 100 4 5 6 7]
print(c) #>>[3 4 5] c不受b影响
a = np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12],[13,14,15,16]])
print("a:\n", a)

b = a[1:3,1:4] #b是>>[[ 6 7 8] [10 11 12]]
print("b:\n", b)

数据分析库pandas

Pandas 属于 Python 第三方数据处理库,它基于 NumPy 构建而来,主要用于数据的处理与分析。我们知道对于机器学习而言数据是尤为重要,如果没有数据就无法训练模型。Pandas 提供了一个简单高效的 DataFrame 对象(类似于电子表格),它能够完成数据的清洗、预处理以及数据可视化工作等。除此之外,Pandas 能够非常轻松地实现对任何文件格式的读写操作,比如 CSV 文件、json 文件、excel 文件。(小伟学长:第三节 基本人工智能工具的介绍与使用 · 语雀)

郭炜老师mooc第十一章数据分析和展示(numpy,pandas, matplotlib),Python基础知识,数据分析,数据挖掘

 pandas.Series(data=None, index=None, dtype=None, name=None, copy=False, fastpath=False)

Pandas 主要的数据结构是 Series(一维)与 DataFrame(二维)

Series是带标签的一维数组,可存储整数、浮点数、字符串、Python 对象等类型的数据,轴标签统称为索引.。

Pandas会默然用0到n-1来作为series的index,但也可以自己指定index(可以把index理解为dict里面的key)。

Series的使用

import pandas as pd
s = pd.Series(data = [80, 90, 100], index = ['Chinese', 'Math', 'English'])
#  pandas.Series(data=None, index=None, dtype=None, name=None, copy=False, fastpath=False)
# Pandas 主要的数据结构是 Series(一维)与 DataFrame(二维)

print(s)

for x in s:
    print(x, end = ' ') # x是data,不输出index
print("#####################")

print(s['Chinese'], s[1])
print(s[0:2]['Math'])
print(s['Math':'English'][1])
for i in range(len(s.index)): #>>语文 数学 英语
    print(s.index[i],end = " $ ")
print('')
s['体育'] = 110 #在尾部添加元素,标签为'体育',值为110
s.pop('Math') #删除标签为'数学’的元素
s2 = s._append(pd.Series(120,index = ['政治'])) #不改变s
# pandas在0.20.0后移除这个append方法,你可以使用 _append 来替换append。

print(s2['Chinese'],s2['政治']) #>>80 120
print(list(s2)) #>>[80, 100, 110, 120]

print("s:\n", s)
print(s.sum(),s.min(),s.mean(),s.median())
#>>290 80 96.66666666666667 100.0 输出和、最小值、平均值、中位数
print(s.idxmax(),s.argmax()) #>>体育 2 输出最大元素的标签和下标

DataFrame的使用

DataFrame是带行列标签的二维表格,它的每一列都是一个Series

pd.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False) 

郭炜老师mooc第十一章数据分析和展示(numpy,pandas, matplotlib),Python基础知识,数据分析,数据挖掘

 【参考文章】:Pandas DataFrame的基本属性详解_pd.dataframe()有哪些参数-CSDN博客

DataFrame的构造和访问
# DataFrame的构造和访问
# DataFrame是带行列标签的二维表格,它的每一列都是一个Series

import pandas as pd
pd.set_option('display.unicode.east_asian_width',True)
#输出对齐方面的设置

scores = [['男',108,115,97],['女',115,87,105],['女',100,60,130],['男',112,80,50]]
names = ['刘一哥','王二姐','张三妹','李四弟']
courses = ['性别','语文','数学','英语']
df = pd.DataFrame(data=scores,index = names,columns = courses)
# pd.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)

print("df:")
print(df)

print("df.values:")
print(df.values)
print("**************")

print(df.values[0][1],type(df.values))#>>108 <class 'numpy.ndarray'>
print(list(df.index)) #>>['刘一哥', '王二姐', '张三妹', '李四弟']
print(list(df.columns)) #>>['性别', '语文', '数学', '英语']
print(df.index[2],df.columns[2]) #>>张三妹 数学
s1 = df['语文'] #s1是个Series,代表'语文'那一列
print("语文那一列:")
print(s1)

print(s1['刘一哥'],s1[0]) #>>108 108 刘一哥语文成绩
print(df['语文']['刘一哥']) #>>108 列索引先写
s2 = df.loc['王二姐'] #s2也是个Series,代表“王二姐”那一行
print(s2['性别'],s2['语文'],s2[2])
#>>女 115 87 王二姐的性别、语文和数学分数
 DataFrame的切片:
#DataFrame的切片:
#iloc[行选择器, 列选择器] 用下标做切片
#loc[行选择器, 列选择器] 用标签做切片
#DataFrame的切片是视图
df2 = df.iloc[1:3] #行切片,是视图,选1,2两行
df2 = df.loc['王二姐':'张三妹'] #和上一行等价
print(df2)

df2 = df.iloc[:,0:3] #列切片(是视图),选0、1、2三列
df2 = df.loc[:,'性别':'数学'] #和上一行等价
print(df2)

df2 = df.iloc[:2,[1,3]] #行列切片
df2 = df.loc[:'王二姐',['语文','英语']] #和上一行等价
print(df2)

df2 = df.iloc[[1,3],2:4] #取第1、3行,第2、3列
df2 = df.loc[['王二姐','李四弟'],'数学':'英语'] #和上一行等价
print(df2)
 DataFrame的分析统计
# DataFrame的分析统计

print("---下面是DataFrame的分析和统计---")
print(df.T) #df.T是df的转置矩阵,即行列互换的矩阵
print(df.sort_values('语文',ascending=False)) #按语文成绩降序排列
# sort_values(....inplace=True,axis=1....) 则原地排序,将各列排序

print(df.iloc[:, 1:].sum()['语文'],df.iloc[:, 1:].mean()['数学'],df.iloc[:, 1:].median()['英语'])
# >>435 85.5 101.0 语文分数之和、数学平均分、英语中位数
print(df.iloc[:, 1:].min()['语文'],df.iloc[:, 1:].max()['数学'])
#>>100 115 语文最低分,数学最高分

print(df.iloc[:, 1:].max(axis = 1)['王二姐']) #>>115 王二姐的最高分科目的分数
print(df['语文'].idxmax()) #>>王二姐 语文最高分所在行的标签
print(df['数学'].argmin()) #>>2 数学最低分所在行的行号
print(df.loc[(df['语文'] > 100) & (df['数学'] >= 85)])
 DataFrame的修改和增删 
# DataFrame的修改和增删

print("---下面是DataFrame的增删和修改---")
df.loc['王二姐','英语'] = df.iloc[0,1] = 150 #修改王二姐英语和刘一哥语文成绩

df['物理'] = [80,70,90,100] #为所有人添加物理成绩这一列
df.insert(1,"体育",[89,77,76,45]) #为所有人插入体育成绩到第1列
df.loc['李四弟'] = ['男',100,100,100,100,100] #修改李四弟全部信息
df.loc[:,'语文'] = [20,20,20,20] #修改所有人语文成绩
df.loc['钱五叔'] = ['男',100,100,100,100,100] #加一行
df.loc[:,'英语'] += 10 #>>所有人英语加10分
df.columns = ['性别','体育','语文','数学','English','物理'] #改列标签
print(df)

删除函数是axis=0表示行,axis = 1表示列。

除了delete用axis=0表示行以外,其他的大部分函数都是axis=1来表示行。

链接:axis = 0,axis = 1到底表示按行计算还是按列计算-CSDN博客

df.drop( ['体育','物理'],axis=1, inplace=True) #删除体育和物理成绩
df.drop( '王二姐',axis = 0, inplace=True) #删除 王二姐那一行
print(df)
 用pandas读excel文档,读取的每张工作表都是一个DataFrame
# 用pandas读excel文档,读取的每张工作表都是一个DataFrame

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

dt = pd.read_excel(r"D:\桌面\excel.xlsx",
                   sheet_name=[0], index_col=0)#读取第0和第1张工作表

df = dt[0] #dt是字典,df是DataFrame
print(df.iloc[0,0]) #>>4080 4080
print(df)

 不想写了,把郭炜老师的讲义截屏下来,后面想深入学习再来看。

郭炜老师mooc第十一章数据分析和展示(numpy,pandas, matplotlib),Python基础知识,数据分析,数据挖掘

郭炜老师mooc第十一章数据分析和展示(numpy,pandas, matplotlib),Python基础知识,数据分析,数据挖掘

郭炜老师mooc第十一章数据分析和展示(numpy,pandas, matplotlib),Python基础知识,数据分析,数据挖掘

 pandas读写csv文件

郭炜老师mooc第十一章数据分析和展示(numpy,pandas, matplotlib),Python基础知识,数据分析,数据挖掘

 

matplotlib

绘制基本直方图

matplotlib.pyplot.figure():
  • Create a new figure, or activate an existing figure.
  • 功能: 创建一个新的图形 或激活一个已有的图形
  • **注意: 若不添加描述,默认图形描述为figure1; **

 函数原型 subplot(nrows, ncols, index, **kwargs),一般我们只用到前三个参数,将整个绘图区域分成 nrows 行和 ncols 列,而 index 用于对子图进行编号。

add_subplot方法的参数是一个三位数:
百位上的数代表画布上下分成几块
十位上的数代表画布左右分成几块
个位上的数代表该块副画布的编号

郭炜老师mooc第十一章数据分析和展示(numpy,pandas, matplotlib),Python基础知识,数据分析,数据挖掘

 【参考链接】python matplotlib fig = plt.figure() fig.add_subplot()-CSDN博客

 

ax.set_title:设置图片的标题;
set_title(self, label, fontdict=None, loc=’center’, pad=None, **kwargs)
参数说明:
fontdict: 一个字典,比如fontdict={‘size’:16}
loc: 位于中间还是两边,可以是center, left, right

ax.set_xlabel:设置图片x轴的名称
ax.set_ylabel:设置图片y轴的名称
ax.set_xticks(x_ticks):设置图片x轴的刻度
ax.set_xticklabels(labels):设置图片x轴刻度上的标签

 注:

ax.set系列函数 的语法与 plt 等效
ax.set_ylabel() plt.ylabel()
ax.set_xlabel() plt.xlabel()
ax.set_xticks() plt.xticks()

 绘制基本直方图:

# 绘制基本直方图

import matplotlib.pyplot as plt #以后 plt 等价于 matplotlib.pyplot
from matplotlib import rcParams
'''
rcParams 是 Matplotlib 库中的一个字典对象,用于存储和管理全局的默认参数配置。
在 Matplotlib 中,可以通过修改 rcParams 中的参数值来改变图形的默认行为。这些参数包括
图形的颜色、线型、线宽、字体样式、图像分辨率等。
rcParams 的全称是“runtime configuration parameters”,它在运行时控制着 Matplotlib 的行为。
通过修改 rcParams 中的参数,您可以自定义 Matplotlib 的默认设置,使其符合您的需求,
而无需在每个图形绘制时都手动指定这些参数。
'''

rcParams['font.family'] = rcParams['font.sans-serif'] = 'SimHei'
#设置中文支持,中文字体为简体黑体

ax = plt.figure().add_subplot() #建图,获取子图对象ax
'''
add_subplot方法的参数是一个三位数:
百位上的数代表画布上下分成几块
十位上的数代表画布左右分成几块
个位上的数代表该块副画布的编号
'''

ax.bar(x = (0.2,0.6,0.8,1.2),height = (1,2,3,0.5), width = 0.1)
#x表示4个柱子中心横坐标分别是0.2,0.6,0.8,1.2
#height表示4个柱子高度分别是1,2,3,0.5
#width表示柱子宽度0.1

'''
ax.bar(x, height, width, bottom, align)
该函数的参数说明,如下表所示:
x 一个标量序列,代表柱状图的x坐标,默认x取值是每个柱状图所在的中点位置,或者也可以是柱状图左侧边缘位置。
height 一个标量或者是标量序列,代表柱状图的高度。
width 可选参数,标量或类数组,柱状图的默认宽度值为 0.8。
bottom 可选参数,标量或类数组,柱状图的y坐标默认为None。
algin 有两个可选项 {“center”,“edge”},默认为 ‘center’,该参数决定 x 值位于柱状图的位置。
该函数的返回值是一个 Matplotlib 容器对象,该对象包含了所有柱状图。
'''
ax.set_title ('我的直方图') #设置标题
'''
ax.set_title:设置图片的标题;
set_title(self, label, fontdict=None, loc=’center’, pad=None, **kwargs)
参数说明:
fontdict: 一个字典,比如fontdict={‘size’:16}
loc: 位于中间还是两边,可以是center, left, right

ax.set_xlabel:设置图片x轴的名称
ax.set_ylabel:设置图片y轴的名称
ax.set_xticks(x_ticks):设置图片x轴的刻度
ax.set_xticklabels(labels):设置图片x轴刻度上的标签
'''

plt.show() 

绘制横向直方图:

barh(y, width, height=0.8, left=None, *, align='center', **kwargs)

matplotlib.pyplot.barh()绘制的都是水平条形图
    y,width,height与bar()里的x,height,width相反
    left等同于bar()里的bottom 不同的时left作用于x轴,bottom作用于y轴
    其他参数作用与bar()参数一致

# 绘制横向直方图

import matplotlib.pyplot as plt #以后 plt 等价于 matplotlib.pyplot
from matplotlib import rcParams
'''
rcParams 是 Matplotlib 库中的一个字典对象,用于存储和管理全局的默认参数配置。
在 Matplotlib 中,可以通过修改 rcParams 中的参数值来改变图形的默认行为。这些参数包括
图形的颜色、线型、线宽、字体样式、图像分辨率等。
rcParams 的全称是“runtime configuration parameters”,它在运行时控制着 Matplotlib 的行为。
通过修改 rcParams 中的参数,您可以自定义 Matplotlib 的默认设置,使其符合您的需求,
而无需在每个图形绘制时都手动指定这些参数。
'''

# rcParams['font.family'] = rcParams['font.sans-serif'] = 'SimHei'
#设置中文支持,中文字体为简体黑体

ax = plt.figure().add_subplot() #建图,获取子图对象ax
'''
add_subplot方法的参数是一个三位数:
百位上的数代表画布上下分成几块
十位上的数代表画布左右分成几块
个位上的数代表该块副画布的编号
'''

ax.barh(y = (0.2,0.6,0.8,1.2),width = (1,2,3,0.5), height = 0.1)
'''
barh(y, width, height=0.8, left=None, *, align='center', **kwargs)

matplotlib.pyplot.barh()绘制的都是水平条形图
    y,width,height与bar()里的x,height,width相反
    left等同于bar()里的bottom 不同的时left作用于x轴,bottom作用于y轴
    其他参数作用与bar()参数一致
'''

ax.set_title ('我的直方图') #设置标题
'''
ax.set_title:设置图片的标题;
set_title(self, label, fontdict=None, loc=’center’, pad=None, **kwargs)
参数说明:
fontdict: 一个字典,比如fontdict={‘size’:16}
loc: 位于中间还是两边,可以是center, left, right

ax.set_xlabel:设置图片x轴的名称
ax.set_ylabel:设置图片y轴的名称
ax.set_xticks(x_ticks):设置图片x轴的刻度
ax.set_xticklabels(labels):设置图片x轴刻度上的标签
'''

plt.show() 

 

绘制堆叠直方图

# 绘制堆叠直方图

import matplotlib.pyplot as plt
ax = plt.figure().add_subplot()
labels = ['Jan', 'Feb', 'Mar', 'Apr']
num1 = [20, 30, 15, 35] #Dept1的数据
num2 = [15, 30, 40, 20] #Dept2的数据
cordx = range(len(num1)) #x轴刻度位置
rects1 = ax.bar(x = cordx, height=num1, width=0.5, color='red',label="Dept1")
rects2 = ax.bar(x = cordx, height=num2, width=0.5, color='green',label="Dept2", bottom=num1) 
# ax.bar(x, height, width, bottom, align)

ax.set_ylim(0, 100) #y轴坐标范围
ax.set_ylabel("Profit") #y轴含义(标签)
ax.set_xticks(cordx) #设置x轴刻度位置,也就是在坐标轴下多出来的一竖
ax.set_xticklabels(labels) #设置x轴刻度下方文字
ax.set_xlabel("In year 2020") #x轴含义(标签)
ax.set_title("My Company") #设置图像名
'''
ax.set系列函数 的语法与 plt 等效
ax.set_ylabel() plt.ylabel()
ax.set_xlabel() plt.xlabel()
ax.set_xticks() plt.xticks()
'''

ax.legend(loc = 2) #在右上角显示图例说明
'''
ax.legend()作用:在图上标明一个图例,用于说明每条曲线的文字显示
legend()有一个loc参数,用于控制图例的位置。 比如 plot.legend(loc=2) , 
这个位置就是4象项中的第二象项,也就是左上角。 loc可以为1,2,3,4 这四个数字。
'''

plt.show()

绘制对比直方图(有多组数据)

# 绘制对比直方图(有多组数据)

import matplotlib.pyplot as plt
ax = plt.figure(figsize=(10,5)).add_subplot()#建图,获取子图对象ax
ax.set_ylim(0,400) #指定y轴坐标范围
ax.set_xlim(0,80) #指定x轴坐标范围

#以下是3组直方图的数据
x1 = [7, 17, 27, 37, 47, 57] #第一组直方图每个柱子中心点的横坐标
x2 = [13, 23, 33, 43, 53, 63] #第二组直方图每个柱子中心点的横坐标
x3 = [10, 20, 30, 40, 50, 60]
y1 = [41, 39, 13, 69, 39, 14] #第一组直方图每个柱子的高度
y2 = [123, 15, 20, 105, 79, 37] #第二组直方图每个柱子的高度
y3 = [124, 91, 204, 264, 221, 175]

rects1 = ax.bar(x1, y1, facecolor='red', width=3, label = 'Iphone')
rects2 = ax.bar(x2, y2, facecolor='green', width=3, label = 'Huawei')
rects3 = ax.bar(x3, y3, facecolor='blue', width=3, label = 'Xiaomi')

ax.set_xticks(x3) #x轴在x3中的各坐标点下面加刻度
ax.set_xticklabels(('A1','A2','A3','A4','A5','A6')) #指定x轴上每一刻度下方的文字
ax.legend() #显示右上角三组图的说明

def label(ax,rects): #在rects的每个柱子顶端标注数值
    for rect in rects:
        height = rect.get_height()
        ax.text(rect.get_x() + rect.get_width()/2, height+14, str(height),rotation=90) #文字旋转90度
#         rect.get_x()获取rect这一条形左边的x坐标的值

        '''
        ax.text(x, y, s, fontdict=None, withdash=False, **kwargs):文本注释,只能填写文本 ;
        x,y:注释的坐标位置(标量)
        s:注释的内容(字符串) 
        fontdict:重新设置注释内容的文本格式,包括字体颜色、背景大小和颜色、字体大小等(字典)
        withdash:创建一个替代注释内容“s”的对象,参照英文单词解释,这应该是一个破折号 ;
        rotation是kwargs中的一个参数
        rotation: [ angle in degrees| 'vertical'(垂直的) | 'horizontal(水平的)' ] 
        '''

label(ax,rects1)
label(ax,rects2)
label(ax,rects3)
plt.show()

 

绘制折线和散点图

# 绘制折线和散点图

import math,random
import matplotlib.pyplot as plt
             
rcParams['font.family'] = rcParams['font.sans-serif'] = 'SimHei'
#设置中文支持,中文字体为简体黑体0

def drawPlot(ax):
    xs = [i / 100 for i in range(1500)] #1500个点的横坐标,间隔0.01
    ys = [10*math.sin(x) for x in xs]
    #对应曲线y=10*sin(x)上的1500个点的y坐标
    ax.plot(xs,ys,"red",label = "Beijing") #画曲线y=10*sin(x)
    ys = list(range(-18,18))
    random.shuffle(ys)  #将ys打乱
    ax.scatter(range(16), ys[:16], c = "blue") #画散点
    ax.plot(range(16), ys[:16], "blue", label="Shanghai") #画折线
    ax.legend() #显示右上角的各条折线说明
    ax.set_xticks(range(16)) #x轴在坐标0,1...15处加刻度
    ax.set_xticklabels(range(16)) #指定x轴每个刻度下方显示的文字
    
ax = plt.figure(figsize=(10, 4),dpi=100).add_subplot() #图像长宽和清晰度(dpi)
drawPlot(ax)
plt.show()

饼状图

matplotlib.pyplot.pie(x, explode=None, labels=None, colors=None, autopct=None, pctdistance=0.6, shadow=False, labeldistance=1.1, startangle=0, radius=1, counterclock=True, wedgeprops=None, textprops=None, center=(0, 0), frame=False, rotatelabels=False, *, normalize=True, data=None)

郭炜老师mooc第十一章数据分析和展示(numpy,pandas, matplotlib),Python基础知识,数据分析,数据挖掘

 郭炜老师mooc第十一章数据分析和展示(numpy,pandas, matplotlib),Python基础知识,数据分析,数据挖掘

 参考文章:python绘制饼图的方法详解_python_脚本之家

# 绘制饼图

import matplotlib.pyplot as plt
def drawPie(ax):
    lbs = ('A', 'B', 'C', 'D') #四个扇区的标签
    sectors = [16, 29.55, 44.45, 10] #四个扇区的份额(百分比)
    expl = [0, 0.1, 0, 0] #四个扇区的突出程度
    ax.pie(x=sectors, labels=lbs, explode=expl, autopct='%.2f', shadow=True, labeldistance=1.1,
        pctdistance = 0.6,startangle = 90)
    '''
    matplotlib.pyplot.pie(x, explode=None, labels=None, colors=None, autopct=None, 
    pctdistance=0.6, shadow=False, labeldistance=1.1, startangle=0, radius=1, 
    counterclock=True, wedgeprops=None, textprops=None, center=(0, 0), frame=False, 
    rotatelabels=False, *, normalize=True, data=None)

'''
    ax.set_title("pie sample") #饼图标题
    
ax = plt.figure().add_subplot()
drawPie(ax)
plt.show()

 绘制雷达图(了解)

# 绘制雷达图

import matplotlib.pyplot as plt
from matplotlib import rcParams #处理汉字用
def drawRadar(ax):
    pi = 3.1415926
    labels = ['EQ','IQ','人缘','魅力','财富','体力'] #6个属性的名称
    attrNum = len(labels) #attrNum是属性种类数,此处等于6
    data = [7,6,8,9,8,2] #六个属性的值
    angles = [2*pi*i/attrNum for i in range(attrNum)]
    #angles是以弧度为单位的6个属性对应的6条半径线的角度
    
    angles2 = [x * 180/pi for x in angles]
    #angles2是以角度为单位的6个属性对应的半径线的角度
    
    ax.set_ylim(0, 10) #限定半径线上的坐标范围
    ax.set_thetagrids(angles2,labels,fontproperties="SimHei" )#绘制6个属性对应的6条半径
    
    ax.fill(angles,data,facecolor= 'g',alpha=0.25) #填充,alpha:透明度
    '''
    matplotlib.pyplot.fill(*args, data=None, **kwargs)
    *args:这个参数主要填写有序数对和颜色。每个多边形可以使用x坐标和y坐标构造,
    只要把这些点连接一起,再把里面的空间进行指定的颜色填充。
    
    ax.fill(x, y) # 使用默认的颜色填充一个多边形
    ax.fill(x, y, “b”) # 使用蓝色填充一个多边形
    ax.fill(x, y, x2, y2) # 使用默认颜色填充两个多边形
    ax.fill(x, y, “b”, x2, y2, “r”) # 一个蓝色,一个红色
    '''
    
rcParams['font.family'] = rcParams['font.sans-serif'] = 'SimHei'
#处理汉字 
ax = plt.figure().add_subplot(projection = "polar") #生成极坐标形式子图
drawRadar(ax)
plt.show()

 绘制多层雷达图(了解)

# 绘制多层雷达图

import matplotlib.pyplot as plt
from matplotlib import rcParams
rcParams['font.family'] = rcParams['font.sans-serif'] = 'SimHei'

pi = 3.1415926
labels = ['EQ','IQ','人缘','魅力','财富','体力'] #6个属性的名称
attrNum = len(labels)
names = ('张三','李四','王五')
data = [[0.40,0.32,0.35], [0.85,0.35,0.30],
[0.40,0.32,0.35], [0.40,0.82,0.75],
[0.14,0.12,0.35], [0.80,0.92,0.35]] #三个人的数据

angles = [2*pi*i/attrNum for i in range(attrNum)]
angles2 = [x * 180/pi for x in angles]

ax = plt.figure().add_subplot(projection = "polar")
ax.fill(angles,data,alpha= 0.25) 
ax.set_thetagrids(angles2,labels)
ax.set_title('三巨头人格分析',y = 1.05) #y指明标题垂直位置
ax.legend(names,loc=(0.95,0.9)) #画出右上角不同人的颜色说明
plt.show()

一个窗口绘制多幅图:

matplotlib.pyplot 模块提供了 subplot2grid(),该函数能够在画布的特定位置创建 axes 对象(即绘图区域)。不仅如此,它还可以使用不同数量的行、列来创建跨度不同的绘图区域。与subplot() 和 subplots() 函数不同,subplot2gird()函数以非等分的形式对画布进行切分,并按照绘图区域的大小来展示最终绘图结果。

plt.subplot2grid(shape, location, rowspan, colspan)

参数含义如下:文章来源地址https://www.toymoban.com/news/detail-840022.html

  • shape:把该参数值规定的网格区域作为绘图区域;
  • location:在给定的位置绘制图形,初始位置 (0,0) 表示第1行第1列;
  • rowsapan/colspan:这两个参数用来设置让子区跨越几行几列。
# 一个窗口绘制多幅图:
#程序中的import、汉字处理及drawRadar、drawPie、drawPlot函数略,见前面程序

fig = plt.figure(figsize=(8,8))
ax = fig.add_subplot(2,2,1) #窗口分割成2*2,取位于第1个方格的子图
drawPie(ax)

ax = fig.add_subplot(2,2,2,projection = "polar")
drawRadar(ax)

ax = plt.subplot2grid((2, 2), (1, 0), colspan=2)
#或写成: ax = fig.add_subplot(2,1,2)

'''
plt.subplot2grid(shape, location, rowspan, colspan)
参数含义如下:
    shape:把该参数值规定的网格区域作为绘图区域;
    location:在给定的位置绘制图形,初始位置 (0,0) 表示第1行第1列;
    rowsapan/colspan:这两个参数用来设置让子区跨越几行几列。
'''

drawPlot(ax)

plt.figtext(0.05,0.05,'subplot sample') #显示左下角的图像标题
plt.show()

到了这里,关于郭炜老师mooc第十一章数据分析和展示(numpy,pandas, matplotlib)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Linux 第十一章

    🐶博主主页: @ᰔᩚ. 一怀明月ꦿ  ❤️‍🔥 专栏系列: 线性代数,C初学者入门训练,题解C,C的使用文章,「初学」C++,linux 🔥 座右铭:“不要等到什么都没有了,才下定决心去做” 🚀🚀🚀大家觉不错的话,就恳求大家点点关注,点点小爱心,指点指点🚀🚀🚀 目录

    2024年04月28日
    浏览(75)
  • 第十一章 请求响应

    将前端发送的请求封装为HttpServletRequest对象 在通过HttpServletResponse 在前后端分离开发中,后端每开发完一个功能,就想要对这个接口功能进行测试 由于是前后端分离开发,所以没有前端页面 我们一般是在浏览器中直接输入地址,来访问我们所开发的web应用 但是浏览器发起的

    2024年01月21日
    浏览(61)
  • shell 第十一章

    1.写一个库函数,用定时任务调用这个库函数,每月1号执行 1.sh:  1.1.sh:   2.以免交互的方式实现 ssh 远程登录,密码错误也直接退出,不用人干预 3.以免交互的方式,实现磁盘分区、格式化、挂载

    2024年02月08日
    浏览(60)
  • 第十一章:deque类

    deque是一种双开口的“连续空间”的容器。 deque(双端队列):是一种双开口的\\\"连续\\\"空间的数据结构,双开口的含义是:可以在头尾两端进行插入和删除操作,且时间复杂度为O(1),与vector比较,头插效率高,不需要搬移元素;与list比较,空间利用率比较高 。 deque并不是真正连

    2024年02月15日
    浏览(41)
  • C国演义 [第十一章]

    力扣链接 给定两个字符串 s 和 t ,编写一个函数来判断 t 是否是 s 的字母异位词 注意:若 s 和 t 中每个字符出现的次数都相同,则称 s 和 t 互为字母异位词 示例 1: 输入: s = “anagram”, t = “nagaram” 输出: true 示例 2: 输入: s = “rat”, t = “car” 输出: false 提示: 1 = s.length, t.

    2024年02月16日
    浏览(52)
  • 第十一章 后端编译与优化

    如果我们把字节码看作是程序语言的一种中间表示形式(Intermediate Representation, IR)的话,那编译器无论在何时、在何种状态下把 Class 文件转换成与 本地基础设施(硬件指令集、操作系统)相关的二进制机器码 ,它都可以视为整个编译过程的后端。 ​ 无论是提前编译器抑

    2024年01月23日
    浏览(50)
  • ChatGPT 之言情作家:第一章到第十一章

    原文:THE CHATGPT ROMANCE AUTHOR 译者:飞龙 协议:CC BY-NC-SA 4.0 和你一样,我喜欢写言情小说,在过去的二十年里,我对流派商业小说中故事构思和作者创业的力量产生了浓厚的兴趣。 我的目标很简单。我想了解如何将故事构思应用到塑造一个引人入胜的商业小说故事中,以吸引

    2024年01月19日
    浏览(66)
  • 第十一章 Unity Transform组件(上)

    本章节我们介绍Transform类,它是一个组件,每一个游戏对象有拥有该组件。因此,它值得我们重点介绍一下。Transform代表了游戏对象的世界变换,也就是移动,选择和缩放。 首先,我们先介绍它的属性(类变量),如下所示 1. gameObject 附加到的当前游戏对象,来自父类Compo

    2024年02月05日
    浏览(44)
  • 【OpenCV】第十一章: 图像金字塔

    第十一章: 图像金字塔 一、什么是图像金字塔¶ 同一张图片不同分辨率的子图的集合。 图像金字塔底部是待处理的高分辨率图像,也就是原始图像,顶部是低分辨率的近似图像。一般情况下,都是每向上移动一级,图像的宽和高都降低为原来的1/2 。 二、为什么要生成图像金

    2024年02月03日
    浏览(52)
  • 西瓜书读书笔记整理(十一) —— 第十一章 特征选择与稀疏学习

    11.1.1 基本概念 特征(feature) :在机器学习中, 特征 是指从数据中提取的用于描述样本的属性或信息。 相关特征(relevant feature) :对当前学习任务 有用 的属性称为 “ 相关特征 ”。 无关特征(inrelevant feature) :对当前学习任务 无用 的属性称为 “ 无关特征 ”。 冗余特

    2024年01月19日
    浏览(57)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包