Python:PDF转长图像和分页图像

这篇具有很好参考价值的文章主要介绍了Python:PDF转长图像和分页图像。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

简介:随着电子化文档的普及,PDF文件的使用频率越来越高。有时我们需要将PDF中的内容转化为图片格式进行分享或编辑,那么如何才能轻松地完成此任务呢?本文将为你展示一个Python工具:如何将PDF文件转化为图片,包括将PDF转化为长图像和每页分别转为单独的图像。

历史攻略:

python:pdf 转 word

安装步骤:

# Ubuntu:
sudo apt-get update
sudo apt-get install python3-pip
sudo apt-get install poppler-utils
pip3 install pdf2image
pip3 install Pillow

# CentOS:
yum update
yum install python3-pip
yum install poppler-utils
pip3 install pdf2image
pip3 install Pillow

# Windows 10:
安装Python:访问Python官网下载并安装Python。
安装poppler:下载poppler for Windows并解压。
设置poppler环境变量:将poppler的bin目录路径添加到系统PATH环境变量中。

# 安装库
pip install pdf2image
pip install Pillow

参数说明:

pdf_path: 输入的PDF文件的路径。
output_image_path: 输出的长图像的路径。
output_folder: 输出的单页图像的文件夹路径。
poppler_path: poppler工具的bin目录路径,此路径是在Windows下必要的,因为pdf2image库需要它来进行PDF到图像的转换。

案例源码:

# -*- coding: utf-8 -*-
# time: 2023/10/23 15:53
# file: pdf2picture.py
# 公众号: 玩转测试开发

import os
from pdf2image import convert_from_path
from PIL import Image


def pdf_to_long_image(pdf_path, output_image_path):
    # 从PDF提取每一页为图像
    pages = convert_from_path(pdf_path, poppler_path='C:\\Users\\poppler-23.08.0\\Library\\bin')

    # 获取总的高度
    total_height = sum(page.height for page in pages)

    # 创建一个空白的长图像
    long_image = Image.new('RGB', (pages[0].width, total_height))

    # 将每一页的图像粘贴到长图像上
    y_offset = 0
    for page in pages:
        long_image.paste(page, (0, y_offset))
        y_offset += page.height

    # 保存长图像
    long_image.save(output_image_path)


def pdf_to_images(pdf_path, output_folder):
    # 将PDF转换为PIL图像列表
    pages = convert_from_path(pdf_path, poppler_path='C:\\Users\\poppler-23.08.0\\Library\\bin')

    # 确保输出文件夹存在
    if not os.path.exists(output_folder):
        os.makedirs(output_folder)

    # 将每页保存为单独的图像
    for i, page in enumerate(pages):
        image_filename = os.path.join(output_folder, f"output_image_page_{i + 1}.png")
        page.save(image_filename, "PNG")


if __name__ == '__main__':
    pdf_path = 'qp_01.pdf'
    output_folder = 'output_images'

    # 使用示例
    pdf_to_long_image('qp_01.pdf', 'output_image.png')
    pdf_to_images(pdf_path, output_folder)

运行结果:

Python:PDF转长图像和分页图像,python,pdf,开发语言

1、使用pdf_to_long_image函数,将得到合并了PDF所有页面长图像。

2、使用pdf_to_images函数,会在指定的输出文件夹中得到每一页PDF的单独图像文件,文件名格式为output_image_page_页码.png。

注意事项:

1、确保已经安装了所有必要的库和工具。

2、输入的PDF文件路径应该是有效的,否则程序会报错。

3、在Windows系统下,确保已经设置了poppler的环境变量或在代码中提供了正确的poppler路径。

4、生成的图像可能会占用较大存储空间,特别是当PDF文件页数较多时。

总结:通过Python可以轻松地实现PDF到图像的转换,不仅可以将整个PDF转为一个长图像,还可以将每一页分别转为单独的图像。这个小工具对于那些经常需要处理PDF的人来说非常有用。文章来源地址https://www.toymoban.com/news/detail-744432.html

到了这里,关于Python:PDF转长图像和分页图像的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 使用Python将图像转换为PDF:一次性解决您的批量转换需求

    导语: 在数字化时代,我们经常需要处理大量的图像文件。将这些图像转换为PDF格式可以方便地存档、分享和打印。本文将介绍如何使用Python编程语言将图像批量转换为PDF,并提供了一个简单易用的图形界面来跟踪转换进度。 在开始之前,请确保您已经安装了以下库: PyM

    2024年02月14日
    浏览(32)
  • Python3 网络爬虫开发实战 第2版 (崔庆才) PDF 高清

    《Python 3 网络爬虫开发实战(第二版)》是由崔庆才所著的一本关于使用 Python 进行网络爬虫开发的书籍。 网络爬虫基础:介绍网络爬虫的基本概念、工作原理和常见的应用场景。 HTTP 协议与 Scrapy 框架:解释 HTTP 协议的基本知识,以及如何使用 Scrapy 框架来构建和管理爬虫项

    2024年04月09日
    浏览(59)
  • Java开发者的Python快速实战指南:实用工具之PDF转DOCX文档(可视化界面)

    首先,大家对Python语法的了解已经基本完成,现在我们需要开始进行各种练习。我为大家准备了一些练习题目,比如之前的向量数据库等,这些题目可以参考第三方的SDK来进行操作,文档也是比较完善的。这个过程有点像我们之前使用Java对接第三方接口的方式,所以今天我想

    2024年02月05日
    浏览(55)
  • 🔥🔥Java开发者的Python快速实战指南:实用工具之PDF转DOCX文档(可视化界面)

    首先,大家对Python语法的了解已经基本完成,现在我们需要开始进行各种练习。我为大家准备了一些练习题目,比如之前的向量数据库等,这些题目可以参考第三方的SDK来进行操作,文档也是比较完善的。这个过程有点像我们之前使用Java对接第三方接口的方式,所以今天我想

    2024年02月05日
    浏览(49)
  • PDF转图片 + 分页

    PDF转图片 有两种方式,一种是请求所有分页后合成一张图片,一种是分页加载 本文推荐后者,前者在实操中 pdf页码过大时 转换超时导致失败 本文需要的依赖是pdf.js pdf.worker.js jquery.js 当然在git上都可以找到 也可以使用本文上传的资源依赖,在这篇文章的上方下载。

    2024年02月16日
    浏览(19)
  • Python操作PDF:PDF文件合并与PDF页面重排

    处理大量的 PDF 文档是非常麻烦的事情,频繁地打开关闭文件会严重影响工作效率。对于一大堆内容相关的 PDF 文件,我们在处理时可以将这些 PDF 文件合并起来,作为单一文件处理,从而提高处理效率。同时,我们也可以选取不同PDF文件中想要的页面制作新的 PDF 文件。本文

    2024年02月06日
    浏览(34)
  • Python怎么将pdf转为图片?Python如何实现pdf文件转图片

    而pdf则是用来保存一些内容已经确定好的数据,因为pdf是无法直接修改内容的,所以也会经常将pdf转为图片来保存。本文就将会来介绍一下pdf转图片的方法,往下看看吧。 1.pdf转图片的话主要实现所需要的模块叫做PyMuPDF,它就是用来操作pdf文件的,通过pip工具下载安装即可。

    2024年02月11日
    浏览(50)
  • 【PDF合并】利用 Python 合并 PDF 文件

    依赖安装 在 Python 中,可以使用 PyPDF2 模块来合并多个 PDF 文件。 首先导入 PdfFileMerger 类。接下来,创建一个 PdfFileMerger 对象 merger。 然后,使用 append 方法逐个添加要合并的 PDF 文件。在示例中,将要合并的 PDF 文件路径存储在列表 pdf_files 中,可以根据实际情况进行修改。

    2024年03月16日
    浏览(71)
  • python从入门到精通pdf下载,python3.8从入门到精通pdf

    本篇文章给大家谈谈python3.8从入门到精通pdf百度云下载,以及python从入门到精通电子书下载,希望对各位有所帮助,不要忘了收藏本站喔。 从0开始学Python,就问你一句:慌不慌? 说句实在的,慌,可能是因为你自己没有完整的规划,其实就是不知道从何下手,七七八八乱学

    2024年02月02日
    浏览(56)
  • 【Python入门教程】Python压缩PDF(fitz、aspose.pdf、PyPDF2)

            我们平时在使用PDF时有时会遇到PDF过大的情况,例如最近我在进行工程制图时,需要将影像使用PDF导出,这就导致PDF文件会非常大,一般有200M左右,这对于数据传输非常不友好。同时有很多软件的PDF压缩功能都需要收费,所以今天就跟大家分享一下如何使用Pyth

    2024年02月22日
    浏览(44)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包