python提取图片文字

1年前作者：搬砖老阿姨分类：Toy博客阅读(9)违法举报

这篇具有很好参考价值的文章主要介绍了python提取图片文字。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

STEP1：安装pillow ，pillow-pil ，pytesseract

pip install pillow
pip install pillow-pil 
pip install pillow-pil

安装完后，可以用

pip list

查看是否安装成功。若是列表中有，则安装成功。

STEP2：安装Tesseract

下载地址：Index of /tesseract

下载完成后双击.exe文件进行安装，语言包这个地方选一下（若是太慢，这个地方不选，后期再装语言包也可以），其他就直接下一步下一步就行，安装目录需要记住，后面添加环境变量需要用到

python图片文字提取,python,python,开发语言

python图片文字提取,python,python,开发语言

python图片文字提取,python,python,开发语言

安装完后添加环境变量，win + R 打开运行窗口，输入sysdm.cpl 或直接电脑属性->高级系统设置

python图片文字提取,python,python,开发语言

或

python图片文字提取,python,python,开发语言

python图片文字提取,python,python,开发语言

python图片文字提取,python,python,开发语言

查看是否安装成功：

运行窗口输入cmd执行tesseract -v

tesseract -v

出现版本号信息说明安装成功 python图片文字提取,python,python,开发语言

文章来源地址https://www.toymoban.com/news/detail-600767.html

具体可参考Tesseract-OCR 下载安装和使用_半濠春水的博客-CSDN博客_tesseract-ocr下载

STEP3：python代码提取文字

文件目录：

python图片文字提取,python,python,开发语言

test.jpg文件内容

python图片文字提取,python,python,开发语言

python代码

from PIL import Image
import pytesseract

def demo():
	image = Image.open('images/test.jpg')
	# lang='chi_sim'是设置成中文识别
	text = pytesseract.image_to_string(image,lang='chi_sim')
	print(text)


if __name__ == "__main__":
	demo()

执行python index.py

输出结果：

python图片文字提取,python,python,开发语言

到了这里，关于python提取图片文字的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

手机图片怎么提取文字？高效渠道一览
随着智能手机的普及，我们现在可以随时随地使用手机拍照记录生活中的点滴。然而，有时候我们拍照之后可能需要提取图片中的文字，比如拍下的菜谱、公告、名片等等。这时，我们就需要使用手机图片提取文字的功能。 - 采用OCR技术拍照识别图片文字，图文转换速度较快
2024年02月09日
浏览(10)
华为手机怎么识别提取图片文字？APP一键识别
平时我们用手机会接触到形形色色的图片文件，其中有一部分保存着咱们需要的文字信息。如果我们是华为手机怎么识别提取图片文字呢？给大伙介绍两种方式，有同样需求的小伙伴接着往下浏览吧。 1.“智慧识屏” 华为手机自带的“智慧识屏”可以实现识别提取图片文字，
2024年02月12日
浏览(14)
javaCV实现java图片ocr提取文字效果
引入依赖：引入中文语言训练数据集：chi_sim GitHub - tesseract-ocr/tessdata: Trained models with fast variant of the \\\"best\\\" LSTM models + legacy models Trained models with fast variant of the \\\"best\\\" LSTM models + legacy models - GitHub - tesseract-ocr/tessdata: Trained models with fast variant of the \\\"best\\\" LSTM models + legacy models https:/
2024年02月11日
浏览(10)
免费，开源，可批量的离线图片文字提取软件OCR
免费，开源，可批量的离线OCR软件适用于 Windows7 x64 及以上免费：本项目所有代码开源，完全免费。方便：解压即用，离线运行，无需网络。批量：可批量导入处理图片，结果保存到本地 txt / md / jsonl 多种格式文件。也可以即时截屏识别。高效：采用 PaddleOCR-json C++ 识别
2024年02月07日
浏览(40)
【批量区域识别内容重命名】批量识别图片区域文字并重命名，批量图片部分识别内容重命文件，PDF区域识别提取重命名
我们在工作和生活中经常遇到这样的需求：比如将以下的图片区域识别进行重命名，批量识别后改成以时间和工作内容重命名，便于日后检索，快速查询首先我们拍摄照片用到的是水印相机，这里的文字呢我们需要加个背景，这样在文字识别就很容易的被识别，准确率也非常
2024年04月25日
浏览(10)
通过Python的pdfplumber库提取pdf中的文字
大家好，我是空空star，本篇给大家分享一下《通过Python的pdfplumber库提取pdf中的文字》。之前给大家分享了《通过Python的PyPDF2库提取pdf中的文字》，感兴趣的同学可以阅读下。本篇演示所用python版本： Python 3.8.9 通过Python的PyPDF2库提取pdf中的文字 pdfplumber是一个用于从PDF文
2024年02月06日
浏览(10)
使用Python批量修改PPT字体和提取全部文字到word
将一份PPT的每一页字体、大小、是否加粗都统一，是一个常见需求。特别是字体统一是高频、热点需求。在python操控PPT常用库python-pptx中有一个bug，对字体的修改只能修改数字和英文字母，无法修改汉字。即 run.font.namet 属性只能修改英文和数字，并且 run.font.name 识别的也是英
2024年02月08日
浏览(7)
通过Python的PyPDF2库提取pdf中的文字
PyPDF2是一个用于处理PDF文件的Python库，它提供了许多用于读取和操作PDF文件的功能。它可以对PDF文件进行合并、分割、旋转、提取页面、加密和解密等操作，也可以添加文本、图像和水印等元素到PDF文件中。 PyPDF2库允许开发人员通过Python代码轻松地处理PDF文件，因为它提供了
2024年02月11日
浏览(12)
python提取pdf图片
2024年02月13日
浏览(9)
python-图片文字识别
两种方法 1. 第一种方法 2. 第二种方法
2024年02月15日
浏览(10)