python提取图片文字

这篇具有很好参考价值的文章主要介绍了python提取图片文字。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

STEP1:安装pillow ,pillow-pil ,pytesseract

pip install pillow
pip install pillow-pil 
pip install pillow-pil

安装完后,可以用

pip list

查看是否安装成功。若是列表中有,则安装成功。

STEP2:安装Tesseract

 下载地址:Index of /tesseract

下载完成后双击.exe文件进行安装,语言包这个地方选一下(若是太慢,这个地方不选,后期再装语言包也可以),其他就直接下一步下一步就行,安装目录需要记住,后面添加环境变量需要用到

                

python图片文字提取,python,python,开发语言

python图片文字提取,python,python,开发语言

python图片文字提取,python,python,开发语言

 安装完后添加环境变量,win + R 打开运行窗口,输入sysdm.cpl 或直接电脑属性->高级系统设置

python图片文字提取,python,python,开发语言

或 

python图片文字提取,python,python,开发语言

 python图片文字提取,python,python,开发语言

python图片文字提取,python,python,开发语言

 查看是否安装成功:

运行窗口输入cmd执行tesseract -v

tesseract -v

 出现版本号信息说明安装成功python图片文字提取,python,python,开发语言

 文章来源地址https://www.toymoban.com/news/detail-600767.html

        

具体可参考Tesseract-OCR 下载安装和使用_半濠春水的博客-CSDN博客_tesseract-ocr下载

STEP3:python代码提取文字

   文件目录:

python图片文字提取,python,python,开发语言

test.jpg文件内容

python图片文字提取,python,python,开发语言

 python代码

from PIL import Image
import pytesseract

def demo():
	image = Image.open('images/test.jpg')
	# lang='chi_sim'是设置成中文识别
	text = pytesseract.image_to_string(image,lang='chi_sim')
	print(text)


if __name__ == "__main__":
	demo()


 执行python index.py

输出结果:

python图片文字提取,python,python,开发语言

 

 

 

到了这里,关于python提取图片文字的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 手机图片怎么提取文字?高效渠道一览

    随着智能手机的普及,我们现在可以随时随地使用手机拍照记录生活中的点滴。然而,有时候我们拍照之后可能需要提取图片中的文字,比如拍下的菜谱、公告、名片等等。这时,我们就需要使用手机图片提取文字的功能。 - 采用OCR技术拍照识别图片文字, 图文转换速度较快

    2024年02月09日
    浏览(45)
  • 华为手机怎么识别提取图片文字?APP一键识别

    平时我们用手机会接触到形形色色的图片文件,其中有一部分保存着咱们需要的文字信息。如果我们是华为手机怎么识别提取图片文字呢?给大伙介绍两种方式,有同样需求的小伙伴接着往下浏览吧。 1.“智慧识屏” 华为手机自带的“智慧识屏”可以实现识别提取图片文字,

    2024年02月12日
    浏览(56)
  • javaCV实现java图片ocr提取文字效果

    引入依赖: 引入中文语言训练数据集:chi_sim GitHub - tesseract-ocr/tessdata: Trained models with fast variant of the \\\"best\\\" LSTM models + legacy models Trained models with fast variant of the \\\"best\\\" LSTM models + legacy models - GitHub - tesseract-ocr/tessdata: Trained models with fast variant of the \\\"best\\\" LSTM models + legacy models https:/

    2024年02月11日
    浏览(47)
  • 免费,开源,可批量的离线图片文字提取软件OCR

    免费,开源,可批量的离线OCR软件 适用于 Windows7 x64 及以上 免费 :本项目所有代码开源,完全免费。 方便 :解压即用,离线运行,无需网络。 批量 :可批量导入处理图片,结果保存到本地 txt / md / jsonl 多种格式文件。也可以即时截屏识别。 高效 :采用 PaddleOCR-json C++ 识别

    2024年02月07日
    浏览(59)
  • 【批量区域识别内容重命名】批量识别图片区域文字并重命名,批量图片部分识别内容重命文件,PDF区域识别提取重命名

    我们在工作和生活中经常遇到这样的需求:比如将以下的图片区域识别进行重命名,批量识别后改成以时间和工作内容重命名,便于日后检索,快速查询 首先我们拍摄照片用到的是水印相机,这里的文字呢我们需要加个背景,这样在文字识别就很容易的被识别,准确率也非常

    2024年04月25日
    浏览(51)
  • 通过Python的pdfplumber库提取pdf中的文字

    大家好,我是空空star,本篇给大家分享一下 《通过Python的pdfplumber库提取pdf中的文字》 。 之前给大家分享了 《通过Python的PyPDF2库提取pdf中的文字》 ,感兴趣的同学可以阅读下。 本篇演示所用python版本: Python 3.8.9 通过Python的PyPDF2库提取pdf中的文字 pdfplumber是一个用于从PDF文

    2024年02月06日
    浏览(43)
  • 使用Python批量修改PPT字体和提取全部文字到word

    将一份PPT的每一页字体、大小、是否加粗都统一,是一个常见需求。特别是字体统一是高频、热点需求。在python操控PPT常用库python-pptx中有一个bug,对字体的修改只能修改数字和英文字母,无法修改汉字。即 run.font.namet 属性只能修改英文和数字,并且 run.font.name 识别的也是英

    2024年02月08日
    浏览(45)
  • 通过Python的PyPDF2库提取pdf中的文字

    PyPDF2是一个用于处理PDF文件的Python库,它提供了许多用于读取和操作PDF文件的功能。它可以对PDF文件进行合并、分割、旋转、提取页面、加密和解密等操作,也可以添加文本、图像和水印等元素到PDF文件中。 PyPDF2库允许开发人员通过Python代码轻松地处理PDF文件,因为它提供了

    2024年02月11日
    浏览(63)
  • python提取pdf图片

    2024年02月13日
    浏览(49)
  • python-图片文字识别

    两种方法 1. 第一种方法 2. 第二种方法

    2024年02月15日
    浏览(47)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包