Python中数据处理(npz、npy、csv文件;元组、列表、numpy数组的使用)

这篇具有很好参考价值的文章主要介绍了Python中数据处理(npz、npy、csv文件;元组、列表、numpy数组的使用)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目录

1.npz文件

2.npy文件

3.csv文件

4.列表、元组、numpy矩阵

①列表

②元组(不可变列表)

③Numpy数组

③Numpy矩阵

1.npz文件

npz是python的压缩文件

①读取文件

#独取文件 读取当前文件夹下的data的mag_cs
dataset = np.load('./data/mag_cs.npz', allow_pickle=True)
#通过上面这行代码得到的是一个`numpy.lib.npyio.NpzFile`文件

NpzFile对象有个属性files

可以通过它查看该压缩文件的所有文件名,通过dataset['文件名']来获取文件内容

print(dataset.files)
print(len(dataset.files))
# 文件内容、type、shape(以adj_matrix.data为例)
print(dataset['adj_matrix.data'])
print(type(dataset['adj_matrix.data']))
print(dataset['adj_matrix.data'].shape)

③保存为.npz文件

# 将x、y、z数组,分别保存为x, sinx, z这三个npz文件
x = np.arange(1, 10)
y = np.sin(x)
z = 2 * x + 0.5
np.savez_compressed('./data/my_dataset', x=x, sinx=y, z=z)
2.npy文件

①读取与保存

import numpy as np
​
data = np.zeros((3,4))
np.save('data.npy', data)   #保存
del data
data = np.load('data.npy')  #读取
​
print('type :', type(data))
print('shape :', data.shape)
print('data :')
print(data)

输出如下:

type : <class 'numpy.ndarray'> shape : (8, 4) data : [[0. 0. 0. 0.] [0. 0. 0. 0.] [0. 0. 0. 0.]]

②npy转csv

  1. 加载npy格式的数据文件

  2. 给每一列数据添加一个列名

  3. 以csv格式保存数据

import pandas as pd
import numpy as np
import csv
​
data = np.load('data.npy')
columns = ['A', 'B', 'C', 'D'] # 这是个list?还是数组?
​
#保存为csv
with open('data.csv', 'w') as f:
    csv_writer = csv.writer(f)
    csv_writer.writerow(columns)
    csv_writer.writerows(data) 
    
#查看保存的csv
df = pd.read_csv('data.csv')
print(df)
3.csv文件

1.使用csv.writer()创建

import csv
 
headers = ['学号','姓名','分数']
rows = [('202001','张三','98'),
        ('202002','李四','95'),
        ('202003','王五','92')]
with open('score.csv','w',encoding='utf8',newline='') as f :
    writer = csv.writer(f)      # 创建
    writer.writerow(headers)    # 写入列名
    writer.writerows(rows)      # 写入数据

2.使用csv.Dictwriter()创建

import csv
 
headers = ['学号','姓名','分数']
rows = [{'学号':'202001','姓名':'张三','分数':'98'},
        {'学号':'202002','姓名':'李四','分数':'95'},
        {'学号':'202003','姓名':'王五','分数':'92'}]
with open('score.csv','w',encoding='utf8',newline='') as f :
    writer = csv.DictWriter(f,headers)
    writer.writeheader()
    writer.writerows(rows)

3.使用writelines()创建:

import csv
 
headers = ['学号,姓名,分数','\n']
csv = ['202001,张三,98','\n',
        '202002,李四,95','\n',
        '202003,王五,92']
with open('score.csv', 'w',encoding='utf8',newline='') as f:
    f.writelines(headers) # write() argument must be str, not tuple
    f.writelines(csv)
4.列表、元组、numpy矩阵

python没有数组

1、元组的元素可以为:元组、列表、字典、集合 (列表作为元组的元素时,列表内的值可以改动)

2、列表的元素可以为:元组、列表、字典、集合

3、字典的元素可以为:元组、列表、字典、集合

4、集合的元素可以为:元组

①列表

列表中存放的数据是可以进行修改,比如"增"、“删”、“改”、“查”

# 使用[]存储,使用 , 分隔每个值
a = [1, 2, 3]
a = [‘xiaoWang’,‘xiaoZhang’,‘xiaoHua’]
​
# 列表中的元素可以是不同类型的
a = [1, ‘a’]
​
# 列表元素修改
a[2] = "我喜欢她啊"
​
#字符串转列表
name = '小阿丁,小红'
list1 = list(name)
​
# 列表的嵌套
info = [['张三', 'M', '45'], ['李四', 'F', '36'], ['王五', 'M', '42']]
#取出李四年龄
print(schoolNames[1][2])
②元组(不可变列表)

元组的元素不能修改。元组使用小括号,列表使用方括号。 元组无法进行增删改。但可以拼接。

tuple = (1, 9, 7, 5, 6, 2,)
​
# 元组转列表
list1 = list(tuple)
# 列表转元组
tuple2 = tuple(list1)
​
# 元组嵌套
tup3 = ('python', (1, 2, 3), 'java', 3)
tup3 = ('python', [1, 2, 3], 'java', 3)
③Numpy数组

Numpy使用ndarray对象来处理多维数组,该对象是一个快速而灵活的大数据容器。

Numpy是专门针对数组的操作和运算进行了设计,所以数组的存储效率远优于Python中的嵌套列表。

Numpy数组中的所有元素的类型都是相同的,而Python列表中的元素类型是任意的。

list可以存储一维数组,通过列表的嵌套可以实现多维数组。

list不具有array的全部属性(如维度、转置等)

import numpy as np
a = np.array([[1,2,0,1],[1,6,9,55],[7,8,9,5]]) #a为数组
print(a.T)                                     #输出a的转置
③Numpy矩阵

Numpy数组(arry)和矩阵(matrix)的区别:

Numpy matrices 是2维的

Numpy arrays (ndarrays) 可以是多维的

Matrix是Array的一个小的分支。matrix 拥有array的所有特性。

numpy中matrix的主要优势是:

相对简单的乘法运算符号。如,matrix: ab,就是矩阵积。 numpy里面arrays遵从逐个元素的运算。如array:cd,相当于matlab里面的c.d运算。而矩阵相乘,则需要numpy里面的dot命令 。文章来源地址https://www.toymoban.com/news/detail-771885.html

到了这里,关于Python中数据处理(npz、npy、csv文件;元组、列表、numpy数组的使用)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【头歌】——数据分析与实践-基于Python语言的文件与文件夹管理-文本 文件处理-利用csv模块进行csv文件的读写操作

    第1关 创建子文件夹 第2关 删除带有只读属性的文件 第3关 批量复制文件夹中的所有文件 未通过本题,如果您通过了本题欢迎补充到评论区,有时间我会整理进来 第1关 读取宋词文件,根据词人建立多个文件 第2关 读取宋词文件,并根据词人建立多个文件夹 第3关 读取宋词文

    2024年01月25日
    浏览(47)
  • 【数据处理】Pandas读取CSV文件示例及常用方法(入门)

    查看读取前10行数据 2067 向前填充 指定列的插值填充 使用某数据填充指定列的空值 示例: 类似切片 array([‘SE’, ‘cv’, ‘NW’, ‘NE’], dtype=object) 类似数据库查询中的groupby查询 先添加新的一列按月将数据划分 聚合,对指定的列按月划分求平均值等 min 最小值 max 最大值 sum

    2024年02月06日
    浏览(52)
  • Python中对CSV数据预处理

    CSV(Comma Separated Values)是一种常用的数据格式,它是以逗号作为分隔符的纯文本文件,通常用于存储大量的数据。在数据分析和机器学习领域,CSV数据预处理是一个必不可少的步骤。在本篇博客中,我们将介绍Python中对CSV数据预处理的所有步骤。 在Python中,我们可以使用

    2024年02月10日
    浏览(29)
  • 开源 SPL 助力 JAVA 处理公共数据文件(txt \csv \ json \xml \xls)

    在 JAVA 应用中经常要处理 txtcsvjsonxmlxls 这类公共格式的数据文件,直接用 JAVA 硬写会非常麻烦,通常要借助一些现成的开源包,但这些开源包也都有各自的不足。 解析库 。这种类库解决了从外部文件到内部对象的问题,比硬编码取数好写,常见的有解析 txtcsv 的 OpenCSV,

    2024年02月01日
    浏览(36)
  • 比赛准备笔记 --- TensotFlow、软件调试、数据预处理(图像,csv数据)

    TensorFlow是由Google团队开发的一个开源深度学习框架,完全基于Python语言设计。它的初衷是以最简单的方式实现机器学习和深度学习的概念,结合了计算代数的优化技术,使计算许多数学表达式变得简单。 优势: 强大的计算能力,支持多种硬件和分布式计算 灵活的数据流模型

    2024年02月06日
    浏览(38)
  • Python:PDF文件处理(数据处理)

    工作中有对PDF文件进行数据抽取,现在总结归纳一下相应的方法,本文包括一下内容: PDF文件分割、拼接; PDF文件抽取图片,简单的图片识别; PDF文件抽取表格; PDF文件抽取文本; PDF文件转docx文件; docx文件数据抽取; 目的:尽可能的将pdf中的数据,抽取出来,尤其是文

    2024年02月09日
    浏览(47)
  • Python处理数据:匹配两个Excel文件数据

    当需要处理两个Excel文件的数据,根据两个Excel的某一些内容进行数据匹配,从而提取出相应的数据时,除了使用Excel自带的Vlookup函数,还能使用Python进行处理。我是不会告诉你们我选择Python处理的原因是对Excel的Vlookup不熟悉的。 目录 1 前言自述 2 需求场景 3 代码实现 4 运行

    2024年02月09日
    浏览(31)
  • Python文件操作和异常处理:高效处理数据的利器

    重温Python,适合新手搭建知识体系,也适合大佬的温故知新~ 1.1 文件操作和异常处理对于编程的重要性 文件操作和异常处理对于编程非常重要。它们使得我们能够处理文件数据、持久化数据、导入和导出数据,并且能够优雅地处理和解决错误,提高程序的可靠性和稳定性。

    2024年01月23日
    浏览(38)
  • Python处理xlsx文件(读取、转为列表、新建、写入数据、保存)

    xlsxwriter**库对于xslx表的列数不做限制, xlrd 库不能写入超过65535行,256列的数据。 由于需要处理的数据行列数较多,遇到报错才发现库的限制问题,记录一下。

    2024年02月12日
    浏览(41)
  • Python小白入门:文件、异常处理和json格式存储数据

    所用资料 代码中所用到的文件可以从下面的网站进行下载: https://www.ituring.com.cn/book/2784 open函数 打开 一个文件。 接收参数为需要打开的文件名 。Python会在 当前执行的文件所在目录下 查找指定文件,因此需要把pi_digits.txt文件放在执行文件的同目录下。 open函数返回一个表示

    2024年02月13日
    浏览(37)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包