鸢尾花数据集即iris
iris数据集文件: https://pan.baidu.com/s/1saL_4Q9PbFJluU4htAgFdQ .提取码:1234
数据集简介
- 数据集包含150个样本(数据集的行)
- 数据集包含4个属性(数据集的列):Sepal Length,Sepal Width,Petal Length,Petal Width:‘feature_names’
- 利用numpy.ndarray存储这150x4的数据:‘data’
- 分类标签取自array[‘Setosa’,‘Versicolour’,‘Virginica’]:‘target_names’
Setosa,Versicolour,Virginica是数据集所包含的3中品种的鸢尾花
这3个分类标签(即150x1数据)用np.ndarray存储:‘target’
总之,这个数据存储了150x4的特征数据和150x1的分类标签,其中特征数据又放在‘data’里,分类标签放在‘target’里
导入数据集
import matplotlib.pyplot as plt #绘图
from mpl_toolkits.mplot3d import Axes3D #可视化
from sklearn import datasets #sklearn中包含很多数据集,其中就有鸢尾花数据集
from sklearn.decomposition import PCA #主成分分析
import numpy as np #机器学习中通常将数据以数组的形式存储,特别是这里包含了特征数据和分类数据
iris = datasets.load_iris() #利用load函数装载数据集
print('鸢尾花数据集的数据类型是:',type(iris))
print('鸢尾花数据集的数据有:',dir(iris))
for i in dir(iris):
eval('print(i,"/t",type(iris.'+i+'))') #遍历数据集中的数据,查看每个数据的数据类型
print()
print('鸢尾花数据集中feature_names取值:',iris.feature_names)
print('鸢尾花数据集中数据的行列数:',iris.data.shape)
print('鸢尾花数据集中target取值:',np.unique(iris.target))
print('鸢尾花数据集中target_names的取值:',iris.target_names)
结果:
可视化
figure(num=None, figsize=None, dpi=None, facecolor=None, edgecolor=None, frameon=True)文章来源:https://www.toymoban.com/news/detail-402175.html
- num:图像编号或名称,数字为编号 ,字符串为名称
- figsize:指定figure的宽和高,单位为英寸;
- dpi参数指定绘图对象的分辨率,即每英寸多少个像素,缺省值为80 1英寸等于2.5cm,A4纸是 21*30cm的纸张
- facecolor:背景颜色
- edgecolor:边框颜色
- frameon:是否显示边框
matplotlib中cla/clf/close用法及相关清除效果文章来源地址https://www.toymoban.com/news/detail-402175.html
- 在使用matplotlib画图时,画完图之后需要进行一定的清理工作,否则后续画图的结果中可能混入前一幅图的数据,或者造成频繁创建绘图对象。下面解释一下matplotlib中的相关清理操作和效果。主要包括以下方法:
- gca获取当前的axes,cla清理当前的axes
- gcf获取当前的figure,clf清理当前的figure
- close,关闭figur
到了这里,关于机器学习——鸢尾花数据集的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!