Python批量实现Word、EXCLE、PPT转PDF文件

这篇具有很好参考价值的文章主要介绍了Python批量实现Word、EXCLE、PPT转PDF文件。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

Python批量实现Word、EXCLE、PPT转PDF文件,Python办公自动化,win32com,办公自动化,批量实现

 一、绪论背景

        在日常办公和文档处理中,有时我们需要将多个Word文档、Excel表格或PPT演示文稿转换为PDF文件。将文档转换为PDF格式的好处是它可以保留文档的布局和格式,并且可以在不同平台上进行方便的查看和共享。

        本篇博文将介绍如何使用Python编程语言批量实现将多个Word、Excel和PPT文件转换为PDF文件。我们将通过使用Python第三方库来读取、编辑和保存这些文档,并使用合适的转换工具将它们转换为PDF格式。

        具体实现方面,我们将首先安装所需的Python库和相关软件,主要使用三个库函数:os, win32com.client, gc。

  1)osos 是Python内置的一个与操作系统交互的库。它提供了许多用于处理文件和目录的函数,例如创建、删除、重命名文件或目录,获取文件属性,遍历目录等。通过使用 os 库,我们可以在Python程序中执行各种与操作系统相关的任务。

  2)win32com.clientwin32com.client 是一个用于与Windows平台上的COM组件进行交互的Python库。COM(Component Object Model)是一种面向对象的组件技术,允许不同的应用程序之间进行通信和交互。win32com.client 库提供了一种方便的方式来调用和操作COM组件,如Microsoft Office应用程序(Word、Excel、PowerPoint等)。通过这个库,我们可以自动化执行一些Office任务,如读写文档、操作Excel表格、创建PPT演示文稿等。

  3)gcgc 是Python内置的垃圾回收模块。垃圾回收是指在程序执行过程中,自动检测和回收不再使用的内存空间,以提高内存利用率和程序性能。gc 模块为我们提供了一些功能,如手动触发垃圾回收、获取和设置垃圾回收的阈值等。尽管Python有自动的垃圾回收机制,但在某些情况下,我们可能需要手动控制垃圾回收的行为。

        然后,我们将编写Python代码来遍历指定文件夹中的所有文档,并对每个文档进行逐个转换。

        最后,我们将保存转换后的PDF文件到指定的目录中。

        通过阅读本篇博文,你将学习到如何使用Python编程语言批量实现将多个Word、Excel和PPT文件转换为PDF文件的方法。这将为你提供一种自动化的方式来处理文档转换任务,节省时间和精力,并提高工作效率。

        无论你是一位办公人员、学生还是有大量文档需要处理的个人用户,本篇教程都将帮助你掌握如何使用Python批量实现Word、Excel和PPT转换为PDF文件。让我们一起开始这个方便实用的文档处理之旅吧!

二、代码实践

   大家运行本代码,只需要更改为自己的路径即可。如代码中我的地址:D:\Pycharmproject2023\code_test_project\shan_test\data,改为你本地地址即可。

import os, win32com.client, gc

# Word
def word2Pdf(filePath, words):
    # 如果没有文件则提示后直接退出
    if (len(words) < 1):
        print("\n【无 Word 文件】\n")
        return
    # 开始转换
    print("\n【开始 Word -> PDF 转换】")
    try:
        print("打开 Word 进程...")
        word = win32com.client.Dispatch("Word.Application")
        word.Visible = 0
        word.DisplayAlerts = False
        doc = None
        for i in range(len(words)):
            print(i)
            fileName = words[i]  # 文件名称
            fromFile = os.path.join(filePath, fileName)  # 文件地址
            toFileName = changeSufix2Pdf(fileName)  # 生成的文件名称
            toFile = toFileJoin(filePath, toFileName)  # 生成的文件地址

            print("转换:" + fileName + "文件中...")
            # 某文件出错不影响其他文件打印
            try:
                doc = word.Documents.Open(fromFile)
                doc.SaveAs(toFile, 17)  # 生成的所有 PDF 都会在 PDF 文件夹中
                print("转换到:" + toFileName + "完成")
            except Exception as e:
                print(e)
            # 关闭 Word 进程
        print("所有 Word 文件已打印完毕")
        print("结束 Word 进程...\n")
        doc.Close()
        doc = None
        word.Quit()
        word = None
    except Exception as e:
        print(e)
    finally:
        gc.collect()


# Excel
def excel2Pdf(filePath, excels):
    # 如果没有文件则提示后直接退出
    if (len(excels) < 1):
        print("\n【无 Excel 文件】\n")
        return
    # 开始转换
    print("\n【开始 Excel -> PDF 转换】")
    try:
        print("打开 Excel 进程中...")
        excel = win32com.client.Dispatch("Excel.Application")
        excel.Visible = 0
        excel.DisplayAlerts = False
        wb = None
        ws = None
        for i in range(len(excels)):
            print(i)
            fileName = excels[i]  # 文件名称
            fromFile = os.path.join(filePath, fileName)  # 文件地址

            print("转换:" + fileName + "文件中...")
            # 某文件出错不影响其他文件打印
            try:
                wb = excel.Workbooks.Open(fromFile)
                for j in range(wb.Worksheets.Count):  # 工作表数量,一个工作簿可能有多张工作表
                    toFileName = addWorksheetsOrder(fileName, j + 1)  # 生成的文件名称
                    toFile = toFileJoin(filePath, toFileName)  # 生成的文件地址

                    ws = wb.Worksheets(j + 1)  # 若为[0]则打包后会提示越界
                    ws.ExportAsFixedFormat(0, toFile)  # 每一张都需要打印
                    print("转换至:" + toFileName + "文件完成")
            except Exception as e:
                print(e)
        # 关闭 Excel 进程
        print("所有 Excel 文件已打印完毕")
        print("结束 Excel 进程中...\n")
        ws = None
        wb.Close()
        wb = None
        excel.Quit()
        excel = None
    except Exception as e:
        print(e)
    finally:
        gc.collect()


# PPT
def ppt2Pdf(filePath, ppts):
    # 如果没有文件则提示后直接退出
    if (len(ppts) < 1):
        print("\n【无 PPT 文件】\n")
        return
    # 开始转换
    print("\n【开始 PPT -> PDF 转换】")
    try:
        print("打开 PowerPoint 进程中...")
        powerpoint = win32com.client.Dispatch("PowerPoint.Application")
        ppt = None
        # 某文件出错不影响其他文件打印

        for i in range(len(ppts)):
            print(i)
            fileName = ppts[i]  # 文件名称
            fromFile = os.path.join(filePath, fileName)  # 文件地址
            toFileName = changeSufix2Pdf(fileName)  # 生成的文件名称
            toFile = toFileJoin(filePath, toFileName)  # 生成的文件地址

            print("转换:" + fileName + "文件中...")
            try:
                ppt = powerpoint.Presentations.Open(fromFile, WithWindow=False)
                if ppt.Slides.Count > 0:
                    ppt.SaveAs(toFile, 32)  # 如果为空则会跳出提示框(暂时没有找到消除办法)
                    print("转换至:" + toFileName + "文件完成")
                else:
                    print("(错误,发生意外:此文件为空,跳过此文件)")
            except Exception as e:
                print(e)
        # 关闭 PPT 进程
        print("所有 PPT 文件已打印完毕")
        print("结束 PowerPoint 进程中...\n")
        ppt.Close()
        ppt = None
        powerpoint.Quit()
        powerpoint = None
    except Exception as e:
        print(e)
    finally:
        gc.collect()


# 修改后缀名
def changeSufix2Pdf(file):
    return file[:file.rfind('.')] + ".pdf"


# 添加工作簿序号
def addWorksheetsOrder(file, i):
    return file[:file.rfind('.')] + "_工作表" + str(i) + ".pdf"


# 转换地址
def toFileJoin(filePath, file):
    return os.path.join(filePath, 'pdf', file[:file.rfind('.')] + ".pdf")


# 开始程序
print("====================程序开始====================")
print(
    "【程序功能】将目标路径下内所有的 ppt、excel、word 均生成一份对应的 PDF 文件,存在新生成的 pdf 文件夹中(需已经安装office,不包括子文件夹)")
print(
    "注意:若某 PPT 和 Excel 文件为空,则会出错跳过此文件。若转换 PPT 时间过长,请查看是否有报错窗口等待确认,暂时无法彻底解决 PPT 的窗口问题(为空错误已解决)。在关闭进程过程中,时间可能会较长,十秒左右,请耐心等待。")


# 需要转换的文件路径
# filePath = input("输入目标路径:(若为当前路径:" + os.getcwd() + ",请直接回车)\n")
filePath = "D:\Pycharmproject2023\code_test_project\shan_test\data"
# 目标路径,若没有输入路径则为当前路径
if (filePath == ""):
    filePath = os.getcwd()

# 将目标文件夹所有文件归类,转换时只打开一个进程
words = []
ppts = []
excels = []

for fn in os.listdir(filePath):
    if fn.endswith(('.doc', 'docx')):
        words.append(fn)
    if fn.endswith(('.ppt', 'pptx')):
        ppts.append(fn)
    if fn.endswith(('.xls', 'xlsx')):
        excels.append(fn)

# 调用方法
print("====================开始转换====================")

# 保存路径:新建 pdf 文件夹,所有生成的 PDF 文件都放在里面
folder = filePath + '\\pdf\\'
if not os.path.exists(folder):
    os.makedirs(folder)

word2Pdf(filePath, words)
excel2Pdf(filePath, excels)
ppt2Pdf(filePath, ppts)
print("====================转换结束====================")
print("\n====================程序结束====================")
# os.system("pause")

三、实践效果

Python批量实现Word、EXCLE、PPT转PDF文件,Python办公自动化,win32com,办公自动化,批量实现

 大家可以自己在本地新建几个文件,试试效果,体验一下把!

参考链接:http://blog.csdn.net/qq_57187936/article/details/125606165文章来源地址https://www.toymoban.com/news/detail-569532.html

到了这里,关于Python批量实现Word、EXCLE、PPT转PDF文件的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【办公自动化】使用Python批量生成PPT版荣誉证书

    🤵‍♂️ 个人主页:@艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬点赞👍🏻 收藏 📂加关注+ 目录 一、Python处理PPT 二、批量生成PPT版荣誉证书  三、往期推荐           使用Python处

    2024年02月12日
    浏览(32)
  • Word、Excel、PPT题库——“办公自动化”

    小雅兰期末加油冲冲冲!!! 1. 【单选题】下列文件扩展名,不属于Word模板文件的是( A )。 A. .DOCX B. .DOTM C. .DOTX D. .DOT 本题的考查点是word基本知识的了解。     .DOCX:word文档。     .DOTM:启用宏的word模板。     .DOTX:word模板。     .DOT:word 97-2003模板。     故本题答案为

    2024年02月07日
    浏览(55)
  • 100天精通Python丨办公效率篇 —— 12、Python自动化操作 office-word(word转pdf、转docx、段落、表格、标题、页面、格式)

    本文收录于 《100天精通Python专栏 - 快速入门到黑科技》专栏 ,是由 CSDN 内容合伙人丨全站排名 Top 4 的硬核博主 不吃西红柿 倾力打造。 基础知识篇以理论知识为主 ,旨在帮助没有语言基础的小伙伴,学习我整理成体系的精华知识,快速入门构建起知识框架; 黑科技应用篇

    2023年04月18日
    浏览(40)
  • 用python批量实现文件夹中所有pdf转成图片并插入到一个word文件中

    要实现这个任务,你需要使用Python的几个库: PyPDF2  用于处理PDF文件, python-docx  用于操作Word文件, PIL (或 Pillow )用于处理图片。 首先,确保你已经安装了这些库。如果没有,你可以使用pip来安装: bash复制代码 pip install PyPDF2 python-docx Pillow 接下来是Python脚本的示例代码

    2024年01月16日
    浏览(48)
  • Java 实现word、excel、ppt、txt等办公文件在线预览功能!

    如何用 Java 实现word、excel、ppt、txt等办公文件在线预览功能?本文告诉你答案! java 实现办公文件在线预览功能是一个大家在工作中也许会遇到的需求,网上些公司专门提供这样的服务,不过需要收费。 如果想要免费的,可以用 openoffice,实现原理就是: 通过第三方工具op

    2024年02月11日
    浏览(38)
  • 【办公自动化】使用Python批量处理Excel文件并转为csv文件

    🤵‍♂️ 个人主页:@艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬点赞👍🏻 收藏 📂加关注+ 目录 前言 一、Python处理Excel 二、批量处理Excel文件并转为csv文件 三、往期推荐          

    2024年02月10日
    浏览(34)
  • python-自动化篇-办公-将PDF文件转存为图片

    因工作中的某些奇葩要求,需要将PDF文件的每页内容转存成按顺序编号的图片。用第三方软件或者在线转换也可以,但批量操作还是Python方便,所谓搞定办公自动化,Python出山,一统天下;Python出征,寸草不生~ O(∩_∩)O 不过这个需要用到 PyMuPDF 库,电脑运行cmd,输入“pip

    2024年02月19日
    浏览(41)
  • 使用Python批量将Word文件转为PDF文件

    说明:在使用Minio服务器时,无法对word文件预览,如果有需要的话,可以将word文件转为pdf文件,再存储到Minio中,本文介绍如何批量将word文件,转为pdf格式的文件; 首先,需要安装一个库, pywin32 ; 可以在cmd窗口敲下面的命令安装,使用阿里云镜像: 如果你使用的是pycha

    2024年02月12日
    浏览(48)
  • python-自动化篇-办公-批量新建文件夹并保存日志信息

    因为业务需要,每天都需要按当天的日期创建很多新文件夹。把这种重复又繁重的操作交给Python来做,一直是我的目标。先说下要求: 默认在桌面新建文件夹。 文件夹命名方式,“月.日-1”,比如7.8-1,7.8-2。7是代表当天的月份,不能显示07。8是代表当天的日期,不能显示

    2024年02月20日
    浏览(37)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包