使用python读取pdf文件的内容
读取第1页的内容:
import PyPDF2
pdfFileObj = open('a.pdf', 'rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObj)
print(pdfReader.numPages)
pageObj = pdfReader.getPage(0)
print(pageObj.extractText())
输出该pdf文件共有多少页,并输出该pdf的第1页的内容。
读取第1-100页的内容:
import PyPDF2
pdfFileObj = open('a.pdf', 'rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObj)
print(pdfReader.numPages)
for i in range(100):
pageObj = pdfReader.getPage(i)
print(pageObj.extractText())
输出该pdf文件共有多少页,并输出该pdf的第1-100页的内容。
注意:将a.pdf与python文件放在同一目录下。
文章来源地址https://www.toymoban.com/news/detail-577952.html文章来源:https://www.toymoban.com/news/detail-577952.html
到了这里,关于python读取pdf文件的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!