【工程实践】python 合并多个csv文件

这篇具有很好参考价值的文章主要介绍了【工程实践】python 合并多个csv文件。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

前言

        处理数据时,有多个csv文件需要合并。有两个方法可以实现,第一个是可以通过python提供的pandas模块,借助 pd.concat()实现多个csv文件的合并。第二个是通过linux命令实现。

1.pandas模块实现

1-1 获得全部csv文件路径

import pandas as pd
import os
#遍历获得文件
def FilesPath(path):
    '''
    path: 目录文件夹地址
    返回值:列表,pdf文件全路径
    '''
    filePaths = [] # 存储目录下的所有文件名,含路径
    for root,dirs,files in os.walk(path):
        for file in files:
            filePaths.append(os.path.join(root,file))
    return filePaths
#获得所以文件路径
Total_file = FilesPath('/home/风机叶片开裂故障预警数据集/train')

【工程实践】python 合并多个csv文件

1-2  查看数据

df = pd.read_csv(Total_file[1],encoding='utf8')

【工程实践】python 合并多个csv文件

1-3 合并数据

data = pd.DataFrame()
for file_path in (Total_file[1:10]):
    df = pd.read_csv(file_path,encoding='utf8')
    data = pd.concat([data,df])

# 重新设置索引 从0开始
data.reset_index(drop=True, inplace=True)
#将合并的data存储
data.to_csv(Total_data_save_path,index = False,encoding='utf8')

2. linux命令实现

2-1 合并数据

        将所有的csv文件合并,并命名为all.csv。

cat csvfile/*.csv > all.csv

2-2 去除标题

        使用cat命令对csv文件合并时,会将每个csv文件的标题一起添加到新文件中,所以需要对all.csv进行去重处理,将重复的标题删除。

data.drop_duplicates(subset=['A','B','C'],keep='first',inplace=True)

参数说明如下:
subset:去重的列名,默认为 None。
keep:有三个可选参数,分别是 first、last、False,默认为 first,表示只保留第一次出现的重复项,删除其余重复项,last 表示只保留最后一次出现的重复项,False 则表示删除所有重复项。
inplace:布尔值参数,默认为 False 表示删除重复项后返回一个副本,若为 Ture 则表示直接在原数据上删除重复项。文章来源地址https://www.toymoban.com/news/detail-511028.html

到了这里,关于【工程实践】python 合并多个csv文件的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • python 合并多个excel文件

    使用 openpyxl 思路: 读取n个excel的文件,存储在一个二维数组中,注意需要转置。 将二维数组的数据写入excel。 安装软件: 源代码: 效果截图: 使用 pandas 思路: 读取n个excel的文件,存储在一个二维数组中,注意需要转置。 将二维数组的数据写入excel。 安装软件: 源代码

    2024年02月14日
    浏览(32)
  • 使用Python合并多个Excel文件

    合并Excel可以将多个文件中的数据合并到一个文件中,这样可以帮助我们更好地汇总和管理数据。日常工作中,合并Excel主要有以下两种需求: 将多个Excel文件合并为一个文件 将多个Excel工作表合并为一个工作表 这篇文章将介绍如何使用第三方Python库 Spire.XLS for Python 实现以上

    2024年02月05日
    浏览(31)
  • Python自动办公之合并多个PDF文件

    本文基于使用pycharm平台,使用glob库和PyPDF2库实现 首先将需要合并的文件放于一个文件中 如下图 addpdf文件夹为需要合并的文件位置 good.py为代码块  代码如下 代码并没有对输入内容进行限制,可能会出现很大问题,但是正常使用是可以的.

    2024年02月11日
    浏览(37)
  • Python 合并多个 PDF 文件并建立书签目录

    今天在用 WPS 的 PDF 工具合并多个文件的时候,非常不给力,居然卡死了好几次,什么毛病?! 心里想,就这么点儿功能,居然收了我会员费都实现不了?不是吧…… 只能自己来了,主要用了 pypdf 库,因为 PyPDF2 版本更新原因,一些类和函数已经过时,截止发文时以下是最新

    2024年02月11日
    浏览(40)
  • Python处理大数据——csv文件类型的小技巧

    当我们遇到一个超大的csv数据文件的时候,双击打开是不现实的。即使打开csv,只能看到104万行的数据,后面都是隐藏的,所以打开也是没有意义的。如果不打开,又无法查看到表的数据结构,就无法进行下一步的工作,比如数据筛选。 一、大数据处理工具 对于超百万行,

    2024年03月14日
    浏览(39)
  • 【办公自动化】使用Python批量处理Excel文件并转为csv文件

    🤵‍♂️ 个人主页:@艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬点赞👍🏻 收藏 📂加关注+ 目录 前言 一、Python处理Excel 二、批量处理Excel文件并转为csv文件 三、往期推荐          

    2024年02月10日
    浏览(34)
  • 【100天精通python】Day27:文件与IO操作_CSV文件处理

    目录  专栏导读   1. CSV文件格式简介 2 csv模块的使用方法 3 读写CSV文件的示例

    2024年02月14日
    浏览(37)
  • Python两种读取txt与csv文件方式(利用numpy处理数据)

    一共80个数据(只截取前10个数据) 在excel中显示的内容 在pycharm中显示的内容 一共80个数据 在记事本中显示的内容 在pycharm中显示的内容 1、读取所有内容 data_pd打印结果 2、数据转为numpy data_np打印结果 1、读取所有内容 data_pd打印结果 2、数据转为numpy data_np打印结果 1、读取所

    2023年04月11日
    浏览(36)
  • Python中数据处理(npz、npy、csv文件;元组、列表、numpy数组的使用)

    目录 1.npz文件 2.npy文件 3.csv文件 4.列表、元组、numpy矩阵 ①列表 ②元组(不可变列表) ③Numpy数组 ③Numpy矩阵 1.npz文件 npz是python的压缩文件 ①读取文件 ② NpzFile 对象有个属性 files 可以通过它查看该压缩文件的所有文件名,通过 dataset[\\\'文件名\\\'] 来获取文件内容 ③保存为.npz文件

    2024年02月03日
    浏览(34)
  • 将多个 CSV 文件导入 Pandas 并连接成一个 Dataframe

    本篇文章介绍如何读取多个 .csv 文件并将所有 DataFrame 连接成一个。 本篇文章将使用 Pandas 读取数据文件并创建和组合 DataFrame。 这个包带有广泛的函数来读取各种数据文件以及执行数据操作技术。 要在您的机器上安装 pandas 包,您必须打开命令提示符/终端并运行 pip install

    2024年02月08日
    浏览(41)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包