实现功能,将程序所在当前路径下的所有PDF文件转化为word
import os
from pdf2docx import Converter
# 获取当前路径
current_path = os.getcwd()
# 遍历当前路径下的所有文件和文件夹
for file_name in os.listdir(current_path):
# 检查文件是否为 PDF 文件
if file_name.endswith(".pdf"):
# 构建输入和输出文件路径
pdf_file_path = os.path.join(current_path, file_name)
docx_file_path = os.path.join(current_path, os.path.splitext(file_name)[0] + ".docx")
# 创建 Converter 对象并将 PDF 转换为 DOCX
cv = Converter(pdf_file_path)
cv.convert(docx_file_path, start=0, end=None)
cv.close()
print(f"已将 {file_name} 转换为 {os.path.basename(docx_file_path)}")
上述代码中使用了 os
模块来获取当前路径及构建文件路径,使用了 pdf2docx
模块来进行 PDF 到 DOCX 的转换。通过遍历当前路径下的所有文件和文件夹,并判断是否是 PDF 文件,将其转换为 DOCX 文件。
可以使用以下命令进行安装pdf2docx
模块:
pip install pdf2docx
运行上述代码后,将会在当前路径下生成与每个 PDF 文件对应的 DOCX 文件。
文章来源地址https://www.toymoban.com/news/detail-607571.html
可执行程序(可直接运行)可从资源中直接下载使用文章来源:https://www.toymoban.com/news/detail-607571.html
到了这里,关于使用python将PDF转word的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!