python读取pdf文件

9月前作者：CH。。。分类：Toy博客阅读(39) 违法举报

这篇具有很好参考价值的文章主要介绍了python读取pdf文件。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

使用python读取pdf文件的内容

读取第1页的内容：

import PyPDF2
pdfFileObj = open('a.pdf', 'rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObj)
print(pdfReader.numPages)

pageObj = pdfReader.getPage(0)
print(pageObj.extractText())

输出该pdf文件共有多少页，并输出该pdf的第1页的内容。

读取第1-100页的内容：

import PyPDF2
pdfFileObj = open('a.pdf', 'rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObj)
print(pdfReader.numPages)

for i in range(100):
    pageObj = pdfReader.getPage(i)
    print(pageObj.extractText())

输出该pdf文件共有多少页，并输出该pdf的第1-100页的内容。

注意：将a.pdf与python文件放在同一目录下。

文章来源地址https://www.toymoban.com/news/detail-577952.html

到了这里，关于python读取pdf文件的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

python读取CSV文件表头字段乱序作json文件(自己笔记)

🌸 欢迎来到Python办公自动化专栏—Python处理办公问题，解放您的双手 🏳️‍🌈 博客主页：一晌小贪欢的博客主页 👍 该系列文章专栏：Python办公自动化专栏文章作者技术和水平有限，如果文中出现错误，希望大家能指正🙏 ❤️ 欢迎各位佬关注！ ❤️

2024年02月11日
浏览(66)
java 读取pdf文件内容

https://blog.csdn.net/ThinkPet/article/details/131256428

2024年02月08日
浏览(45)
C++&Python&C# 三语言OpenCV从零开发(3):图像读取和显示

C++PythonCsharp in OpenCV 专栏【2022B站最好的OpenCV课程推荐】OpenCV从入门到实战全套课程（附带课程课件资料+课件笔记） OpenCV4 C++ 快速入门视频30讲 - 系列合集 OpenCV4 C++ 课程笔记在上一章纠结过教程的选择之后，还是觉得老老实实从零开始学OpenCV，从OpenCV C++视频教程开始。这

2024年01月21日
浏览(58)
C++&Python&C# 三语言OpenCV从零开发(4):视频流读取

C++PythonCsharp in OpenCV 专栏【2022B站最好的OpenCV课程推荐】OpenCV从入门到实战全套课程（附带课程课件资料+课件笔记） OpenCV 教程中文文档|OpenCV中文 OpenCV教程中文文档|W3Cschool OpenCV基础教程——视频的读取与写入(超详细+附代码) 我之前写过一篇基于Python的，我现在重新写一次

2024年01月21日
浏览(71)
【PDFBox】PDFBox操作PDF文档之读取指定页面文本内容、读取所有页面文本内容、根据模板文件生成PDF文档

这篇文章，主要介绍PDFBox操作PDF文档之读取指定页面文本内容、读取所有页面文本内容、根据模板文件生成PDF文档。目录一、PDFBox操作文本 1.1、读取所有页面文本内容 1.2、读取指定页面文本内容 1.3、写入文本内容 1.4、替换文本内容（1）自定义PDTextStripper类（2）创建Key

2024年02月16日
浏览(62)
蓝凌EIS pdf.aspx 任意文件读取漏洞

漏洞描述：蓝凌EIS智慧协同平台是一个简单、高效的工作方式专为成长型企业打造的沟通、协同、社交的移动办公平台，覆盖OA、沟通、客户、人事、知识等管理需求，集合了非常丰富的模块，满足组织企业在知识、项目管理系统建设等需求的一款OA系统。漏洞描述蓝凌EI

2024年01月16日
浏览(49)
【Python笔记】Python + xlrd + pymysql读取excel文件数据并且将数据插入到MySQL数据库里面

这篇文章，主要介绍Python + xlrd + pymysql读取excel文件数据并且将数据插入到MySQL数据库里面。目录一、Python读取excel 1.1、安装xlrd库 1.2、打开excel工作簿 1.3、获取sheet工作表 1.4、操作row数据行 1.5、操作column数据列 1.6、操作单元格二、读取excel数据保存到MySQL 2.1、完整代码 2.

2024年02月15日
浏览(56)
【CAD开发】glTF和b3dm文件格式读取（C++，Python）

官网地址： https://www.khronos.org/gltf/ glTF™ 是一种免版税规范，用于通过引擎和应用程序高效传输和加载 3D 场景和模型。 glTF 定义了一种可扩展的发布格式，通过在整个行业中实现 3D 内容的互操作使用来简化创作工作流程和交互式服务。 glTF™（GL 传输格式）用于在 Web 和本机

2023年04月08日
浏览(61)
Python-pdfplumber读取PDF内容

PDF是一种编写文档格式，便于跨操作系统传播文档。Python的开源库 pdfplumber，可以较为方便地获取pdf的各种信息，包含pdf的基本信息（作者、创建时间、修改时间…）及表格、文本、图片等信息，基本可以满足较为简单的格式转换功能。 1、可以轻松访问有关每个PDF对象的详细

2024年04月26日
浏览(36)
PDF.js - 免费开源的 JavaScript 读取、显示 PDF 文档的工具库，由 Mozilla 开发并且持续维护

最近新项目需要处理 PDF，研究了 PDf.js 之后觉得很不错，于是写篇文章推荐给大家。 PDF.js 的功能和它的名字一样简单，是一个使用 HTML5 技术来让前端网页支持读取、解析和显示 PDF 文档的 JS 工具库。这个项目由大名鼎鼎的 Mozilla 组织开发并且更新维护着，没错，就是那个开

2024年01月21日
浏览(50)

python读取pdf文件

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

支付宝扫一扫领取红包，优惠每天领

二维码1

二维码2