为什么使用fitz读取pdf转为图片模糊

这篇具有很好参考价值的文章主要介绍了为什么使用fitz读取pdf转为图片模糊。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

出现这样的原因有可能是因为,在进行页面读取的时候未指定读取的dpi是多少,使得默认读取去96dpi
所以在进行读取时使用

    page = doc.load_page(page_number)

    # 获取页面的图像对象
    pix = page.get_pixmap(dpi=200)

遇到苦难找文档哦
牢记 : \color{red}{牢记:} 牢记:help()和查看官方文档呀

import fitz
from PIL import Image

# 打开PDF文件
doc = fitz.open(r"C:\Users\O-c-O\Desktop\11.pdf")

# 遍历每个页面
for page_number in range(doc.page_count):
    # 加载页面
    page = doc.load_page(page_number)

    # 获取页面的图像对象
    matrix = fitz.Matrix(1.0, 1.0)  # 1.0 表示原始尺寸
    # pix = page.get_pixmap(matrix=matrix,dpi=200)
    pix = page.get_pixmap(dpi=200,alpha=False)

    print(pix.width,pix.height)
    # 将图像转换为Pillow的Image对象
    img = Image.frombytes("RGB", [pix.width, pix.height], pix.samples)

    # 保存图像为PNG格式,不进行压缩
    dpi = 120  # 设置所需的 DPI 值
    img.save(f'output_{page_number}.png', dpi=(dpi, dpi),)
    # img.save(f'output_{page_number}.png',)

# 关闭文档对象
doc.close()

相关的其他参数还有:文章来源地址https://www.toymoban.com/news/detail-531745.html

  • matrix:指定应用于页面的转换矩阵(fitz.Matrix 对象)。默认为
    None,表示不应用任何转换。通过调整缩放、旋转和裁剪等操作,可以对页面进行自定义的转换。
  • clip:指定是否裁剪图像以适应页面边界框。默认为 False,表示不进行裁剪。
  • alpha:指定是否提取图像的透明通道。默认为 False,表示不提取透明通道。
  • dpi:指定图像的采样密度(每英寸像素数量)。默认为 None,表示使用默认的采样密度。
  • band_width:指定每个带宽条的像素宽度。默认为 0,表示禁用带宽条。
  • band_height:指定每个带宽条的像素高度。默认为 0,表示禁用带宽条。
  • band_sep:指定带宽条之间的像素间隔。默认为 0,表示禁用带宽条。
  • band_rows:指定在图像传输期间要生成的带宽条的行数。默认为 0,表示禁用带宽条。

到了这里,关于为什么使用fitz读取pdf转为图片模糊的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 为什么 Windows 系统对 PDF 支持不佳?

    PDF(Portable Document Format)是一种电子文件格式,其文件格式结构是由一系列称为“PDF”的文件组成的。这些文件的后缀名通常是“.pdf”。 PDF文件的优点在于它们可以被电子设备独立解析和打开,而不需要依赖操作系统和应用程序。此外,PDF文件还可以进行编辑、转换和分享

    2024年02月06日
    浏览(63)
  • 通过Python的fitz库提取pdf中的图片

    大家好,我是空空star,本篇给大家分享一下 《通过Python的fitz库提取pdf中的图片》 。 Fitz库是一个Python图像处理库,主要用于打开、编辑和保存PDF、TIFF和JPEG格式的图像。它可以帮助用户读取和写入PDF文件,提取PDF页面以及在页面上进行标记和注释。此外,Fitz库还提供了一些

    2024年02月07日
    浏览(52)
  • 为什么pdf拆分出几页之后大小几乎没有变化

    PDF 文件的大小在拆分出几页之后几乎没有变化可能有几个原因: 图像压缩 : 如果 PDF 文件中包含图像,而这些图像已经被压缩过,拆分后的页面依然会保留这些压缩设置,因此文件大小可能不会显著变化。 文本和矢量图形 : PDF 文件中的文本和矢量图形通常不占用太多空间,

    2024年04月14日
    浏览(58)
  • 为什么Tomcat的NIO在读取body时要模拟阻塞?

    文章首发地址 Tomcat的NIO完全可以以非阻塞方式处理IO,为什么在读取body部分时要模拟阻塞呢?在Tomcat的NIO读取HTTP请求时,为了保证请求的正确性和可靠性,需要模拟阻塞模式,这是因为servlet规范里定义了ServletInputStream在读数据时是阻塞模式。 ServletInputStream在读取数据时是阻

    2024年02月13日
    浏览(55)
  • mac为什么不支持ntfs,mac读取ntfs移动硬盘软件有哪些

    品牌型号:MacBook Pro 2020款 系统: macOS11.6.5 软件版本:Tuxera NTFS for Mac 熟悉mac电脑的用户都知道,Mac原生系统不能写入NTFS格式硬盘,但是Windows电脑可以正常使用NTFS格式硬盘,mac为什么不支持ntfs呢?实际上Mac电脑可以借助一些NTFS for Mac类的软件让Mac电脑支持读写NTFS格式硬盘,

    2024年02月04日
    浏览(60)
  • 使用Python将PDF转为图片

    将PDF转为图片能方便我们将文档内容上传至社交媒体平台进行分享。此外,转换为图片后,还可以对图像进行进一步的裁剪、调整大小或添加标记等操作。  用Python将PDF文件转JPG/ PNG图片 可能是大家在一些项目中会遇到的需求,下面将详细介绍如何使用第三方库Spire.PDF for P

    2024年02月08日
    浏览(75)
  • 在Vue中动态引入图片为什么要用require

    静态资源和动态资源 静态资源 动态的添加src 动态资源 我们通过网络请求从后端获取的资源 动态的添加src会被当成静态资源 动态的添加src最终会被打包成: 动态的添加图片最会会被编译成一个静态的字符串,然后再浏览器运行中会去项目中查找这个资源, 静态资源编译 默

    2024年02月13日
    浏览(52)
  • 如何使用Python将PDF转为图片

    将PDF转为图片能方便我们将文档内容上传至社交媒体平台进行分享。此外,转换为图片后,还可以对图像进行进一步的裁剪、调整大小或添加标记等操作。 用Python将PDF文件转JPG/ PNG图片 可能是大家在一些项目中会遇到的需求,下面将详细介绍如何使用第三方库 Spire.PDF for Py

    2024年02月08日
    浏览(82)
  • 为什么Flink-CDC读取Decimal等数值类型变成了非数值字符串

    每遇到一个问题,在经过努力研究明白之后,总想写点东西记录。怎奈又没这个好习惯,过了一两天这个激情就没了,想写也写不出来了。最近在做一个flink-cdc采集数据的测试和产品化开发,遇到一个数据转换的问题,折腾了我两个早上,有些心血来潮,就记录一下吧,对我

    2023年04月09日
    浏览(55)
  • 【C&C++】为什么 scanf 函数在读取字符串时不需要用取地址运算符 &

    在C语言中,字符串实际上是字符数组,所以我们可以使用 scanf 函数来读取字符串。但是,需要注意的是, scanf 在读取字符串时会在遇到空格、制表符或换行符时停止。因此,它不能用于读取包含空格的字符串。 以下是使用 scanf 读取字符串的基本示例: 在这个例子中,我们

    2024年01月20日
    浏览(50)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包