1.导入数据 import numpy as np import csv 2.获取数据 iris_data=[] with open("iris.csv") as csvfile: csv_reader=csv.reader(csvfile) #用csv.reader读取csvfile文件 birth_header=next(csv_reader) #读取第一行各列标题 for row in csv_reader: iris_data.append(row) 3.数据清理,去掉索引号 iris_list=[] for row in iris_data: iris_list.append(tuple(row[1:])) iris_list 4.数据统计 (1)创建数据类型 datatype=np.dtype([("Sepal.Length",np.str_,40), ("Sepal.Width",np.str_,40), ("Petal.Length",np.str_,40), ("Petal.Width",np.str_,40), ("Species",np.str_,40)]) datatype (2)创建二维数组 iris_data=np.array(iris_list,dtype=datatype) iris_data (3)将待处理数据的类型转化为float类型 PetalLength=iris_data["Petal.Length"].astype(float) PetalLength (4)排序 np.sort(PetalLength) (5)数据去重 np.unique(PetalLength) (6)对指定列求和、均值、标准差、方差、最小值及最大值 print("sum:",np.sum(PetalLength)) print("mean:",np.mean(PetalLength)) print("std:",np.std(PetalLength)) print("var:",np.var(PetalLength)) print("min:",np.min(PetalLength)) print("max:",np.max(PetalLength))
运行结果如下:
文章来源地址https://www.toymoban.com/news/detail-723581.html文章来源:https://www.toymoban.com/news/detail-723581.html
到了这里,关于Python:读取iris数据集中鸢尾花的萼片,花瓣长度,并对其进行排序、去重、并求出和,累计和,均值,标准差、方差、最大值和最小值的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!