python 处理pdf加密文件

10月前分类：Toy博客阅读(47) 违法举报

这篇具有很好参考价值的文章主要介绍了python 处理pdf加密文件。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

近期有同事需要提取加密的pdf文件，截取其中的信息，并且重构pdf文件。网上没有搜到相关的pdf操作，于是咨询了chatgpt，给出了pypdf2的使用案例。但是时间比较久远了，很多库内的调用接口都已经更新了。

于是自行到官方的库内学习相关接口使用。整理的处理代码如下：

# -*- coding: utf-8 -*-
"""
Created on Thu Jan 11 10:36:17 2024

@author: xm AZHE
"""

import PyPDF2
file=r'C:\Users\xm\Downloads\xxx1.pdf'
# 打开PDF文件
pdf_file = open(file, 'rb')

# 创建一个PDF阅读器对象
pdf_reader = PyPDF2.PdfReader(pdf_file)

# 创建一个新的PDF写入器对象
pdf_writer = PyPDF2.PdfWriter()

# 截取第0，第101到108页
page = pdf_reader.pages[0]
pdf_writer.add_page(page)
for i in range(101,109):
    page = pdf_reader.pages[i]
    pdf_writer.add_page(page)
    # 顺便导出下每页的图片
    count = 0
    for image_file_object in page.images:
        with open(str(count) + image_file_object.name, "wb") as fp:
            fp.write(image_file_object.data)
            count += 1
    # 打印下下每页的文字
    page.extract_text(0)
    
# 处理的文件加个密
pdf_writer.encrypt("123456")

# 创建一个新的PDF文件并将页面写入其中
out_file=file.replace('.pdf','_remake.pdf')
output_file = open(out_file, 'wb')
pdf_writer.write(output_file)

# 关闭文件
output_file.close()
pdf_file.close()

PS: 解密用

if reader.is_encrypted:
    reader.decrypt("123456")

文章来源地址https://www.toymoban.com/news/detail-779936.html

到了这里，关于python 处理pdf加密文件的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

Python3，9行批量提取PDF文件的指定内容，这种操作，保证人见人爱....

小屌丝：鱼哥，你有没有什么办法，提取PDF文档的内容。小鱼：这个还问我？？小屌丝：哎呀，这个不是被难住了嘛。小鱼：有啥难得？提示你一下，小屌丝：嗯，可以可以。小鱼：去我的博文找，没记错的话，有两种方法提取pdf的文字。小屌丝：好嘞，我这就去

2024年02月04日
浏览(46)
Python：PDF文件处理（数据处理）

工作中有对PDF文件进行数据抽取，现在总结归纳一下相应的方法，本文包括一下内容： PDF文件分割、拼接； PDF文件抽取图片，简单的图片识别； PDF文件抽取表格； PDF文件抽取文本； PDF文件转docx文件； docx文件数据抽取；目的：尽可能的将pdf中的数据，抽取出来，尤其是文

2024年02月09日
浏览(80)
python实现弹窗选择需要处理的文件

近期，在学习hadoop,包括hadoop的搭建，使用及利用Python操作hadoop。偶然间发现python的GUI功能，原来没有用过，因为没有对应的需求，所以没有太多的去关注。现在做了一下，感觉作用其实很大的。可以开发许多小工具。 python实现弹窗选择需要处理的文件对于开发人员来说，前

2023年04月16日
浏览(40)
改进python批量处理pdf文件插入word页码乱问题

2024年01月18日
浏览(53)
Python打开文件并进行处理，txt、excel、pdf、word！

在办公处理中，我们常常要打开一些文件，面临大量的数据时，传统的人工方法耗时耗力。在python中，有一系列包装好的库，让我们能够很方便的操作各种类型的文件。当然，python的内置函数也能够很好的打开一些文件。本文主要探讨python打开各类文件的方式。本文介绍的主

2023年04月08日
浏览(95)
捕捉时刻：将PDF文件中的图像提取为个性化的瑰宝（从pdf提取图像）

应用场景：该功能的用途是从PDF文件中提取图像。这在以下情况下可能会很有用：图片提取和转换：可能需要将PDF文件中的图像提取出来，并保存为单独的图像文件，以便在其他应用程序中使用或进行进一步处理。例如，可能需要将PDF中的图像用于网页、报告、演示文稿等

2024年02月14日
浏览(50)
PDF文件加密怎么解除？10大PDF解除加密工具榜单

PDF 文件可能包含与个人信息、官方信息或家庭信息相关的重要数据，或者通常是您不希望他人访问的数据。为了防止数据被伪造、滥用或操纵，密码用于保护 PDF 文件。但是，当您忘记或放错了访问文件的特定密码时，可能会出现这种情况。在这种情况下，您通常会搜索 PD

2024年02月05日
浏览(44)
python提取图片型pdf中的文字（提取pdf扫描件文字）

前言文字型pdf提取，python的库一大堆，但是图片型pdf和pdf扫描件提取，还是有些难度的，我们需要用到OCR（光学字符识别）功能。一、准备 1、安装OCR（光学字符识别）支持库首先要安装 pytesseract 和 Tesserac OCR ，Tesseract OCR是一种广泛使用的OCR工具，它可以用于从图像中提取

2024年03月23日
浏览(72)
如何批量提取pdf文件名到excel？

nbsp; nbsp; 如何批量提取pdf文件名到excel？在大家整理PDF文档的时候会不会遇到下面这些问题，首先PDF过多，每个PDF文件都有自己的名字，我们想要分类排放的话非常麻烦，不仅耗费时间而且带来的收益非常低，然后即使我们整理好了PDF文档，后续想要寻找这些PDF文档的话也是

2024年02月03日
浏览(61)
赛效：PDF文件怎么加密

1：在网页上打开并登录91ai工具，在特色功能里点击“PDF加密”。 2：点击上传文件，将本地PDF文件添加上去。 3：文件上传成功后，在文件下方设置密码后点击“开始加密”。 4：加密完成后点击下方下载按钮，将加密后的文档下载到电脑本地。 5：下载成功后再次从电脑本地

2024年02月12日
浏览(55)