python读取Excel指定范围并转为数组

这篇具有很好参考价值的文章主要介绍了python读取Excel指定范围并转为数组。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

        最近需要读取Excel中的内容,然后进行后续操作,对于这块知识,博主以前以为自己不会涉及到,但是现在一涉及到,第一步就错了,搞了好久。真的心累。因此写了这篇博客。 

目的:excel中存放着数据,如果要进行计算及其它操作,首先就要进行读取。

目录

安装

初阶 

进阶1

进阶2

进阶3

总结​​​​​​​

我们先来看一下python中能操作Excel的库对比(一共九个库):

python读取Excel指定范围并转为数组

可以发现,还是挺多的

这里使用的是xlrd库。

安装

这里首先就是导入这个包,

pip install xlrd==1.2.0

       xlrd包版本最好是1.2.0,因为笔者使用2.多版本的xlrd时,代码出现了类似下面的报错,也就是说xlrd版本太高会导致无法支持读取xlsx后缀的excel。

xlrd.biffh.XLRDError: Excel xlsx file; not supported

python读取Excel指定范围并转为数组

大家可以去试试将excel另存,看看保存类型。

目前笔者使用的是Excel2019版本的,默认保存类型为xlsx。

如果你之前已经安装xlrd高版本或更低版本了,建议先卸载一下,重新安装。

pip uninstall xlrd
pip install xlrd==1.2.0

实例

初阶 

python读取Excel指定范围并转为数组

一个excel中有如上数据,我们需要将其提取出来,方便python进行后续操作。

代码如下:

def extract1(file,index=0):
    workbook = xlrd.open_workbook(file)
    worksheet = workbook.sheet_by_index(index)
    rows = worksheet.nrows
    all = []
    for i in range(rows):
        a = worksheet.row_values(i)[:]
        all.append(a)
    print(all)
    cc = np.array(all)
    print(cc)
    return cc

file是文件的路径及名称,index就是当前sheet表的索引。 下图就是具体的索引。

python读取Excel指定范围并转为数组

当然也可以根据sheet表的名称。

如下面代码第一行按照的是索引方式,第二行按照的是sheet名称。大家可自行选择

    worksheet = workbook.sheet_by_index(0)
    worksheet = workbook.sheet_by_name("sheet1")

rows = worksheet.nrows

返回的是sheet表的行数,ncols则是列数

    all = []
    for i in range(rows):
        a = worksheet.row_values(i)[:]
        all.append(a)

首先定义一个空列表,然后遍历每行,将里面的数据写入列表中,

row_values()

是用来返回给定行中单元格值的切片。 

最后将其转换成数组类型即可。(按要求来,大家也可以不换)

下图是结果:

python读取Excel指定范围并转为数组

换个高级的写法,用推导式写(浓缩才是精华)

def extract(file,index=0):
    workbook = xlrd.open_workbook(file)
    worksheet = workbook.sheet_by_index(index)
    rows = worksheet.nrows
    c = tuple(worksheet.row_values(i)[:] for i in range(rows))
    a = np.array(c)
    print(a)
    return a

 代码行数瞬间缩短了。

最好调用一下函数即可

file = r'C:\Users\knighthood\OneDrive\桌面\11.xlsx'
extract1(file)

进阶1

        要求:假如我excel只要图中框出来的区域。

python读取Excel指定范围并转为数组

以下为了看的较为简便,我使用推导式的代码

def confine_array(file,index=0):
    workbook = xlrd.open_workbook(file)
    worksheet = workbook.sheet_by_index(index)
    rows = worksheet.nrows
    c = tuple(worksheet.row_values(i)[1:] for i in range(1, rows))
    a = np.array(c)
    print(a)
    return a

如上,可以发现,代码变化之处就下面这一行。

    c = tuple(worksheet.row_values(i)[1:] for i in range(1, rows))

一步步讲解:

①for i in range(1, rows)

        首先对于后面的for循环,i控制的就是获取的行,更改其范围就会更改获取到的行、行数。

如果是上面说的(1,rows),则对应着获取第二行到最后一行,(0表示第一行)

②worksheet.row_values(i)[1:]

        最后的[1:](本来的代码中是没有或者是[:])表示的是i行的元素从第2列(个)获取到最后一行(个)。

因此我们只需要更改这两处就可以获得不同的内容矩阵(如下)。

def flexible_array(file,index=0,row=1,col=1):
    workbook = xlrd.open_workbook(file)
    worksheet = workbook.sheet_by_index(index)
    rows = worksheet.nrows
    c = tuple(worksheet.row_values(i)[col:] for i in range(row,rows))
    a = np.array(c)
    print(a)
    return a

结果如下图 

python读取Excel指定范围并转为数组

进阶2

        要求:能不能更简化一点,根据我从哪个位置要数据,如第二行第二列开始,将这后面的数据进行读取。每次这样对来对去,容易出错,还是根据行列开始计算比较方便。

python读取Excel指定范围并转为数组

这里为了防止行列一样,我就多加了一列。

def flexible1_array(file,index=0,row=1,col=1):
    workbook = xlrd.open_workbook(file)
    worksheet = workbook.sheet_by_index(index)
    rows = worksheet.nrows
    c = tuple(worksheet.row_values(i)[col-1:] for i in range(row-1,rows))
    a = np.array(c)
    print(a)
    return a

代码也主要变化了这一行 

    c = tuple(worksheet.row_values(i)[col-1:] for i in range(row-1,rows))

这里笔者就不多解释了。 

python读取Excel指定范围并转为数组现在就可以根据需要的起始单元格所在的行列进行选取所要的内容。

进阶3

        要求:不需要最后一列

python读取Excel指定范围并转为数组

这里的话,笔者就设置了最后需要的行和列作为结束的读取。

def flexible2_array(file,index=0,row=1,col=1,end_row=None,end_col=None):
    workbook = xlrd.open_workbook(file)
    worksheet = workbook.sheet_by_index(index)
    rows = worksheet.nrows
    if end_row is None:
        c = tuple(worksheet.row_values(i)[col-1:end_col] for i in range(row-1, rows))
    else:
        c = tuple(worksheet.row_values(i)[col - 1:end_col] for i in range(row - 1, end_row))
    a = np.array(c)
    print(a)
    return a

        上述代码意思是,如果不输入结束的行和列,读取到的是包含数据的行列,如果输入了行和列(或者其中一个),就读取相应的内容。由于end_row放在range()函数中,因此需要加个if判断。

结果如下:

python读取Excel指定范围并转为数组

python读取Excel指定范围并转为数组

        此外,我还发现,end_col由于放在[]中,可输入负数(不懂的可以去看看python列表负索引)。

不过这里的-1,其实际是排除了最后一列,从你输入的行列到,你输入的结束行和倒数第二列。

有些人可能会觉得别扭(比如我,更喜欢-1表示从起始列到最后一列,-2表示从起始列到倒数第二列)

def flexible3_array(file,index=0,row=1,col=1,end_row=None,end_col=None):
    workbook = xlrd.open_workbook(file)
    worksheet = workbook.sheet_by_index(index)
    rows = worksheet.nrows
    if end_row is None:
        c = tuple(worksheet.row_values(i)[col-1:end_col if end_col > 0 else end_col+1] for i in range(row-1, rows))
    else:
        c = tuple(worksheet.row_values(i)[col-1:end_col if end_col > 0 else end_col+1] for i in range(row - 1, end_row))
    a = np.array(c)
    print(a)
    return a

这里,代码中将判断end_col是否为负,使用了if-else写在一行。减少了很多代码判断量,使看起来更简洁。 

python读取Excel指定范围并转为数组

这里看个人喜好是否使用这个方法。 

        还有一个end_col参数使用负数的原因是,end_row由于在excel中对应的是行,其用的是数字表示,而excel中列用字母表示,因此如果当数据列数太多的时候(如下图),去数列还是挺麻烦的

python读取Excel指定范围并转为数组

总结

        上述内容是一步一步进行修改添加的,对应着平时要求的逐渐添加,功能的逐渐完善。

        笔者在上篇构建层次分析法,用到的数据矩阵,可以和这篇一起结合,通过excel读取转为数组,然后进行层次分析法的操作。文章来源地址https://www.toymoban.com/news/detail-411036.html

到了这里,关于python读取Excel指定范围并转为数组的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包赞助服务器费用

相关文章

  • EXCEL上传指定行读取数据 可直接使用

    前提:需要引入easyExcel 前置条件 entity 中文数字转换器 1.继承AnalysisEventListener 2.EXCEL文件读取工具 3.excel文件上传

    2024年02月12日
    浏览(9)
  • panda读取excel文件内容时出错,提示excel表格不能被指定

    panda读取excel文件内容时出错,提示excel表格不能被指定

    panda读取excel文件内容时出错,提示exc表格不能被指定,详细内容如下:      Excel file format cannot be determined, you must specify an engine manually. 源码如下(panda包和xlrd包都已经导入): 根据报错内容来到显示报错的代码中 当ext等于none时,提示这个错误。那么ext是怎么等于none的呢,

    2024年02月16日
    浏览(14)
  • 利用MATLAB读取.nc文件单像元数值并转为Excel格式(以中国日降雨量月均数据为例)

    利用MATLAB读取.nc文件单像元数值并转为Excel格式(以中国日降雨量月均数据为例)

     以中国日降雨量月均数据(nc文件包含12月)为例,提取某经纬度下的多月份像元值。 (【数据分享】1960-2020年中国1公里分辨率月降水数据集) 一、确定经纬度所在行列 号 以 92.18E,30.475N 为例,首先在Matlab中输入以下代码: 工作区获取到lat、lon和pre的信息,打开lat和lon文件

    2024年02月07日
    浏览(30)
  • 如何使用Python将PDF转为Excel

    如何使用Python将PDF转为Excel

    PDF文件是一种静态文档格式,通常难以编辑,而Excel则是一个灵活的表格工具。如果你需要处理PDF表格中的数据,那么将其导出为Excel文件可以大大节省工作时间和精力。Excel提供的强大数据编辑和格式化功能,允许你对转换后的PDF数据进行修改、排序、筛选、计算等操作。同

    2024年02月05日
    浏览(6)
  • Python实用技巧:将 Excel转为PDF

    Python实用技巧:将 Excel转为PDF

    将Excel文件转换为PDF可以方便储存表格数据,此外在打印或共享文档时也能确保表格样式布局等在不同设备和操作系统上保持一致。今天给大家分享一个使用第三方Python库Spire.XLS for Python 实现Excel转PDF的简单方法。 1. 首先,通过pip命令来安装依赖库; 2. 安装完成后,导入所需

    2024年02月05日
    浏览(13)
  • Python处理xlsx文件(读取、转为列表、新建、写入数据、保存)

    xlsxwriter**库对于xslx表的列数不做限制, xlrd 库不能写入超过65535行,256列的数据。 由于需要处理的数据行列数较多,遇到报错才发现库的限制问题,记录一下。

    2024年02月12日
    浏览(41)
  • python 读取视频有多少帧并将视频转为GIF动态图

    目录 1 python读取视频帧 2 python 将MP4格式视频前500帧转为动态图 3 python 将MP4格式视频第2688到2890帧转为动态图,并将gif图片的七分之一列和后七分之一列裁掉 4 python 将MP4格式视频第2688到2890帧转为动态图,并将gif图片的七分之一行和后七分之一行裁掉 要读取视频有多少帧,可

    2024年02月11日
    浏览(9)
  • Python实现Word、Excel、PPT批量转为PDF

    Python实现Word、Excel、PPT批量转为PDF

    今天看见了一个有意思的脚本Python批量实现Word、EXCLE、PPT转PDF文件。 因为我平时word用的比较的多,所以深有体会,具体怎么实现的我们就不讨论了,因为这个去学了也没什么提升,不然也不会当作脚本了。这里我将其放入了pyzjr库中,也方便大家进行调用。 你可以去下载p

    2024年02月10日
    浏览(40)
  • opencv-python 将图像迷宫转为迷宫数组

    opencv-python 将图像迷宫转为迷宫数组

    起因是我想做个自动走迷宫的外挂(其实是想做点实践),所以我需要在游戏中捕捉画面并自动寻路,然后再控制自动移动,此为第一部分:捕捉画面。 1.取得图像迷宫 2.处理图像 3.图像分割 4.生成数组 首先我们得捕捉屏幕画面,即获得迷宫图像,这里我是在steam上面找了一

    2024年02月07日
    浏览(8)
  • python + selenium实现巨潮资讯网指定范围年报下载

    python + selenium实现巨潮资讯网指定范围年报下载

    大家好!第一次写文章,紧张滴捏!    这段时间在做课设,课设里需要下载沪市600000到601000号的年报原文做数字化的词频分析,想着用程序帮我批量下载一下,但是找了一下貌似没有类似的代码,就写了一个应用selenium库来做模拟下载的python代码。 写的很烂,爬的很

    2024年02月05日
    浏览(8)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包