基于Pycharm的Excel文件导入以及数据处理

这篇具有很好参考价值的文章主要介绍了基于Pycharm的Excel文件导入以及数据处理。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

基于Pycharm的Excel文件导入以及数据处理

用了一天的时间进行学习了利用python进行导入excel文件以及处理数据。由于自己是第一次学习,因此特地将所学知识进行总结与分享。

1.包的选取

据我所知,目前常用处理Excel的包主要包括xlrdpandas

xlrdpandas 都是 Python 中用于处理 Excel 文件的库,但它们在功能和使用上有一些重要的异同点。

异同点:

1.1 功能和用途:

  • xlrd 是一个库,主要用于读取 Excel 文件的内容。它提供了一种基本的方式来从 Excel 文件中提取数据,但不支持写入或修改 Excel 文件。
  • pandas 是一个强大的数据处理库,其中包含用于读取和写入 Excel 文件的功能,以及各种数据处理和分析工具。它可以用于读取、处理、分析和写入 Excel 数据,同时还支持多种数据格式和操作。

1.2. 数据结构:

  • xlrd 以一种较为低级的方式返回 Excel 数据,通常是原始的行和列数据。
  • pandas 使用自定义的数据结构,主要是 DataFrame 和 Series,它们更适合数据分析和操作。DataFrame 是一个表格数据结构,可以容纳多种数据类型,而 Series 是一维数组,通常用于表示单列数据。

1.3. 数据处理:

  • xlrd 提供了基本的读取功能,但如果需要进行更复杂的数据操作,需要编写额外的代码。
  • pandas 提供了丰富的数据处理和操作功能,包括数据过滤、转换、聚合、合并、透视等,使得处理和分析数据变得更加简单和高效。

1.4. 性能:

  • xlrd 通常比 pandas 更快,因为它是专门用于读取 Excel 数据的库,没有额外的数据结构和操作的开销。
  • pandas 在处理大型数据集时可能会稍慢,因为它提供了更多的功能和抽象。

选择适合的库:

  • 如果您只需要读取 Excel 文件的内容,并且对数据进行简单的查看或提取操作,xlrd 可能是一个合适的选择,因为它更轻量级且性能较好。
  • 如果您需要进行更复杂的数据处理、分析和转换操作,或者需要将 Excel 数据与其他数据源集成,那么 pandas 是更强大和灵活的工具,它提供了更多的功能来满足您的需求。

通常,根据您的具体需求和项目复杂性,您可以选择使用 xlrdpandas,或两者结合使用,以便充分利用它们的优势。

2.基于xlrd、pandas包进行讲解

现在对两种包处理数据进行分别说明:

2.1 Xlrd包

xlrd包比较老旧,只能处理后缀为.xls的文件,而pandas包则可以处理更多格式,比较新。文章来源地址https://www.toymoban.com/news/detail-723003.html

import xlrd
book = xlrd.open_workbook('SOWC_2014_Stat_Tables_Table_9.xls')
sheet = book.sheet_by_name('Table 9 ')
data = {}
for i in range(14, sheet.nrows):
# 从第14行开始,因为这是国家数据的起点。 ➋
  row = sheet.row_values(i)
  country = row[1]
  data[country] = {
  'child_labor': {
  'total': [row[4], row[5]],
  'male': [row[6], row[7]],
  'female': [row[8], row[9]],
  },
  'child_marriage': {
  'married_by_15': [row[10], row[11]],
  'married_by_18': [row[12], row[13]],
  }
}
  if country == 'Zimbabwe':
    break #中断程序
import pprint
pprint.pprint(data)

2.2 Pandas包

import pandas as pd
import pprint

# 读取Excel文件
df = pd.read_excel('SOWC_2014_Stat_Tables_Table_9.xls', sheet_name='Table 9 ', skiprows=13)  # skiprows=14
data = {}  # 创建一个空字典
# print(df)
for row in range(200):  # 遍历df的每一行
  row_data = df.iloc[row]
  country = row_data[0]
  # print(country)
  data[country] = {
    'child_labor': {
      'total': [row_data[4], row_data[5]],
      'male': [row_data[6], row_data[7]],
      'female': [row_data[8], row_data[9]],
    },
    'child_marriage': {
      'married_by_15': [row_data[10], row_data[11]],
      'married_by_18': [row_data[12], row_data[13]],
    }
  }
pprint.pprint(data)
# # 创建一个空字典

到了这里,关于基于Pycharm的Excel文件导入以及数据处理的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 前端基于XLSX实现数据导出到Excel表格,以及提示“文件已经被损坏,无法打开”的解决方法

    一、vue实现导出excel 1、前端实现 xlsx是一个用于读取、解析和写入Excel文件的JavaScript库。它提供了一系列的API来处理Excel文件。使用该库,你可以将数据转换为Excel文件并下载到本地。这种方法适用于在前端直接生成Excel文件的场景。 更多介绍可参见官网 1、安装xlsx依赖 2、引

    2024年01月23日
    浏览(84)
  • vs code导入excel文件并且解析excel文件数据

    实习工作需要通过vs code导入excel文件并且解析excel文件数据,学习整理了一下相关方法分享给大家^_^ 要在 VS Code 中导入和解析 Excel 文件,你可以使用一些库和扩展来帮助你完成这个任务。以下是一种常用的方法: 安装必要的库和扩展: 安装  pandas  库:在终端窗口中运行 

    2024年02月03日
    浏览(64)
  • 把前端传来的数据导入到excel文件

    [  {\\\"nameFirst\\\": \\\"test1\\\", \\\"nameSecond\\\": \\\"test1\\\", \\\"nameThird\\\": \\\"test1\\\"},  {\\\"nameFirst\\\": \\\"test2\\\", \\\"nameSecond\\\": \\\"test2\\\", \\\"nameThird\\\": \\\"test2\\\"}]  

    2024年01月22日
    浏览(38)
  • 数据分类分级 数据识别-excel分类分级模版文件导入、解析

    前面讲了数据分类分级 数据识别-实现部分敏感数据识别,本次针对模版导入展开,excel导入采用的是easyexcel 上面图片是AI创作生成!如需咒语可私戳哦! 之前的excel导入解析采用的是Apache poi,但是在Java领域解析、生成Excel比较有名的框架如Apache poi,jxl等,在使用的时候,存在

    2024年02月05日
    浏览(44)
  • 微信小程序 -- 数据库数据excel文件批量导入

    一、excel文件批量导入数据到数据库 1.创建node.js函数upload,点击upload右键外部终端中安装类库 2.云函数代码 js代码

    2024年02月12日
    浏览(67)
  • C#将数据库数据导出到Excel & 将Excel文件导入到数据库

    1、读取Excel数据并写入到SQLServer数据库中; 2、将SQLServer数据库中的数据写入到Excel表中; 以下部分程序代码:  完整代码程序及配套测试数据库数据如下: https://download.csdn.net/download/XueJiaoKui/85331183 https://download.csdn.net/download/XueJiaoKui/85331183

    2024年02月16日
    浏览(46)
  • C#使用MiniExcel导入导出数据到Excel/CSV文件

    MiniExcel简介 简单、高效避免OOM的.NET处理Excel查、写、填充数据工具。 目前主流框架大多需要将数据全载入到内存方便操作,但这会导致内存消耗问题,MiniExcel 尝试以 Stream 角度写底层算法逻辑,能让原本1000多MB占用降低到几MB,避免内存不够情况。 特点: 低内存耗用,避免

    2024年02月19日
    浏览(57)
  • 利用Aspose.Word对Word文件添加印章处理以及实现业务数据的替换处理

    有时候,我们在处理大量文档的时候,需要批量给Word文档添加印章处理,方便打印操作,本篇随笔介绍利用Aspose.Word对Word文件添加印章处理以及实现业务数据的替换处理。 简单的文档处理效果如下所示。 和其他处理文档类似,我们首先根据Word文件路径,构建一个Aspose.Word

    2024年02月16日
    浏览(43)
  • UnityExcel数据查看以及文件导入

    需要插件EPPlus.dll、Excel.dll /// summary /// 读取 Excel 表并返回一个 DataRowCollection 对象 /// /summary /// param name=\\\"_path\\\"Excel 表路径/param /// param name=\\\"_sheetIndex\\\"读取的 Sheet 索引。Excel 表中是有多个 Sheet 的/param /// returns/returns private static DataRowCollection ReadExcel(string _path, int _sheetIndex = 0) { F

    2024年02月13日
    浏览(36)
  • 用sql将excel文件导入数据库(Microsoft.ACE.OLEDB.12.0)

    1、将xlsx(或者xls文件,需要将文件后缀修改)文件数据插入数据库中 2、将csv文件数据插入数据库中 其中, \\\"HDR=yes;\\\"是说Excel文件的第一行是列名而不是数据,\\\"HDR=no;\\\"正好与前面的相反。 \\\"IMEX=1 \\\"如果列中的数据类型不一致,使用\\\"IMEX=1\\\"可必免数据类型冲突。 3、判断路径下是

    2024年02月12日
    浏览(39)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包