基于Tesseract模块Python实现提取图片中的文字信息(安装+使用教程)

这篇具有很好参考价值的文章主要介绍了基于Tesseract模块Python实现提取图片中的文字信息(安装+使用教程)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。


Python实现提取图片中的文字可以使用Optical Character Recognition (OCR) 技术来解决。OCR是指将图像中的文本转换成可编辑的文本的过程。Python有许多OCR库,但最流行和最广泛使用的是Tesseract库。

下面是一个使用Python和Tesseract来提取图像中的文本的简单示例代码。

0. OCR技术介绍


OCR,即光学字符识别(Optical Character Recognition),是一种将印刷体字符转化为计算机可读文字的技术。OCR技术可以将纸质文档、扫描文档、照片等转化为可编辑的电子文件,方便用户进行编辑、存储和共享。

OCR技术的应用范围非常广泛。例如,银行和保险公司可以使用OCR技术来处理各种表格和文件,包括支票、发票、合同等,从而提高办公效率。医院可以使用OCR技术来处理病历、处方和医学报告,从而提高医疗质量和效率。政府机构可以使用OCR技术来处理各种表格和文件,例如税务申报表、选民登记表等,从而提高政府服务的效率和质量。

OCR技术的原理是利用光学扫描仪将纸质文档转化为数字图像,然后通过图像处理算法将图像中的字符识别出来,并转化为计算机可读的文字。OCR技术的核心是字符识别算法,这个算法需要考虑到各种字体、字号、字距、倾斜度、噪声等因素。

OCR技术的发展历史可以追溯到20世纪50年代,当时的OCR技术只能处理单一字体、字号、字距的文本。随着计算机技术的不断发展,OCR技术也不断进步,现在的OCR技术能够处理各种字体、字号、字距、倾斜度、噪声等复杂条件下的文本,并且具备高精度和高速度的特点。

总之,OCR技术是一种非常实用的技术,可以帮助用户将纸质文档转化为电子文件,从而提高办公效率和工作质量。随着计算机技术的不断进步,OCR技术也将不断发展,为用户提供更加高效和便捷的服务。

1. 安装模块


1、安装Tesseract、Tesseract、Pillow模块,可以使用以下命令:

pip install pytesseract
pip install pillow
pip install tesseract-ocr # 如果这个安装报错就用下面的手动安装方法

2、从网上找到相应的‘Tesseract-OCR’下载安装(自行寻找对应版本):https://digi.bib.uni-mannheim.de/tesseract/
基于Tesseract模块Python实现提取图片中的文字信息(安装+使用教程)

3、无脑默认安装即可,安装后的默认文件路径为(这里使用的是Windows版本):C:\Program Files\Tesseract-OCR\


4、找到python的安装路径下的pytesseract,不知道在哪里的的在cmd控制执行pip show pytesseract

例如我的就在D:\Python3.8\Lib\site-packages\pytesseract

基于Tesseract模块Python实现提取图片中的文字信息(安装+使用教程)

5、进入上面的路径,打开pytesseract.py文件:

基于Tesseract模块Python实现提取图片中的文字信息(安装+使用教程)


6、然后将源码中的tesseract_cmd = 'tesseract',更改为:

tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'

2. 导包


然后,导入必要的库:

import cv2
import pytesseract

3. 读取图像


接下来,读取图像并将其转换为灰度:

img = cv2.imread('image.png')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

4. 提取字符串


然后调用pytesseract库的“image_to_string”函数,将图像转换为字符串:

text = pytesseract.image_to_string(gray)

5. 打印输出


print(text)

运行结果:
基于Tesseract模块Python实现提取图片中的文字信息(安装+使用教程)


6. 完整代码

import cv2
import pytesseract

img = cv2.imread(r'image.png')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
text = pytesseract.image_to_string(gray)
print(text)

《100天精通Python》专栏推荐白嫖80g Python全栈视频

《100天精通Python从入门到就业》:本专栏专门针对零基础和需要进阶提升的同学所准备的一套完整教学,从0到100的不断进阶深入,后续还有实战项目,轻松应对面试,专栏订阅地址:https://blog.csdn.net/yuan2019035055/category_11466020.html文章来源地址https://www.toymoban.com/news/detail-449531.html

  • 优点订阅限时9.9付费专栏进入千人全栈VIP答疑群,作者优先解答机会(代码指导、远程服务),群里大佬众多可以抱团取暖(大厂内推机会)!
  • 专栏福利简历指导、招聘内推、每周送实体书、80G全栈学习视频、300本IT电子书:Python、Java、前端、大数据、数据库、算法、爬虫、数据分析、机器学习、面试题库等等
    基于Tesseract模块Python实现提取图片中的文字信息(安装+使用教程)
    基于Tesseract模块Python实现提取图片中的文字信息(安装+使用教程)

到了这里,关于基于Tesseract模块Python实现提取图片中的文字信息(安装+使用教程)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包赞助服务器费用

相关文章

  • python提取图片文字

    python提取图片文字

    STEP1:安装pillow ,pillow-pil ,pytesseract 安装完后,可以用 查看是否安装成功。若是列表中有,则安装成功。 STEP2:安装Tesseract  下载地址:Index of /tesseract 下载完成后双击.exe文件进行安装,语言包这个地方选一下(若是太慢,这个地方不选,后期再装语言包也可以),其他就

    2024年02月16日
    浏览(8)
  • 用python实现提取word中的所有图片

    你可以使用python-docx库来处理word文件,然后遍历文件中的所有形状,找到图片。 首先,你需要安装python-docx库。在命令行中输入以下命令进行安装: 复制代码 pip install python-docx 然后,你可以使用以下代码提取word文件中的所有图片: python复制代码 from docx import Document from doc

    2024年01月21日
    浏览(10)
  • javaCV实现java图片ocr提取文字效果

    引入依赖: 引入中文语言训练数据集:chi_sim GitHub - tesseract-ocr/tessdata: Trained models with fast variant of the \\\"best\\\" LSTM models + legacy models Trained models with fast variant of the \\\"best\\\" LSTM models + legacy models - GitHub - tesseract-ocr/tessdata: Trained models with fast variant of the \\\"best\\\" LSTM models + legacy models https:/

    2024年02月11日
    浏览(7)
  • 提取图像中的文本信息(Tesseract OCR 和 pytesseract)

    提取图像中的文本信息(Tesseract OCR 和 pytesseract)

    安装Tesseract:点这里参考本人博客 这个库只自带了一个英语的语言包,这个时候如果我们图片中有对中文或者其他语言的识别需求,就需要去下载其他语言包 进入官网以后进入Traineddata Files 找到这个位置 tessdata_best适用于愿意以大量速度换取稍微好一点的准确性的人。它也是

    2024年02月12日
    浏览(38)
  • 通过Python的pdfplumber库提取pdf中的文字

    大家好,我是空空star,本篇给大家分享一下 《通过Python的pdfplumber库提取pdf中的文字》 。 之前给大家分享了 《通过Python的PyPDF2库提取pdf中的文字》 ,感兴趣的同学可以阅读下。 本篇演示所用python版本: Python 3.8.9 通过Python的PyPDF2库提取pdf中的文字 pdfplumber是一个用于从PDF文

    2024年02月06日
    浏览(10)
  • 通过Python的PyPDF2库提取pdf中的文字

    通过Python的PyPDF2库提取pdf中的文字

    PyPDF2是一个用于处理PDF文件的Python库,它提供了许多用于读取和操作PDF文件的功能。它可以对PDF文件进行合并、分割、旋转、提取页面、加密和解密等操作,也可以添加文本、图像和水印等元素到PDF文件中。 PyPDF2库允许开发人员通过Python代码轻松地处理PDF文件,因为它提供了

    2024年02月11日
    浏览(12)
  • 使用opencv+tesseract识别图片中的表格

    使用opencv+tesseract识别图片中的表格

    在java环境中使用opencv和tesserac识别一个图片表格 环境:opencv和tesseract安装在linux环境下,docker将运行springboot服务 opencv和tesseract的安装和docker加载可参考之前的文章 将图片进行预处理,过滤掉颜色等干扰元素 提取图片的水平线和垂直线,并进行重叠过滤 得到水平线和垂直线

    2024年02月21日
    浏览(8)
  • Python识别图片中的文字

    Python识别图片中的文字

    不知道大家有没有遇到过这样的问题,就是在某个软件或者某个网页里面有一篇文章,你非常喜欢,但是不能复制。或者像百度文档一样,只能复制一部分,这个时候我们就会选择截图保存。但是当我们想用到里面的文字时,还是要一个字一个字打出来。那么我们能不能直接

    2024年01月18日
    浏览(12)
  • 【C++开发】Qt+Tesseract实现文字识别的各种坑(已解决)

    【C++开发】Qt+Tesseract实现文字识别的各种坑(已解决)

            最近在给之前Qt医疗管理系统项目添加一个文字识别功能,但是在其中遇到非常多坑,花费了我比较多的时间(查阅了很多文章),这篇文章主要用来整理这些坑(非常详细)。 Qt版本:Qt5.13 VS版本:VS2017 编译器(构建套件):Desktop Qt 5.13.0 MSVC2017 64bit 以上环境都

    2024年02月08日
    浏览(10)
  • python3去除图片中的文字水印

    python3去除图片中的文字水印

    以下为代码: 可根据水印颜色,将np.clip(1.4 * img + 20, 0, 255)中的1.4更改为1.1~1.7,20更改为-40~40,从而达到更好的效果。

    2024年01月25日
    浏览(11)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包