STEP1:安装pillow ,pillow-pil ,pytesseract
pip install pillow
pip install pillow-pil
pip install pillow-pil
安装完后,可以用
pip list
查看是否安装成功。若是列表中有,则安装成功。
STEP2:安装Tesseract
下载地址:Index of /tesseract
下载完成后双击.exe文件进行安装,语言包这个地方选一下(若是太慢,这个地方不选,后期再装语言包也可以),其他就直接下一步下一步就行,安装目录需要记住,后面添加环境变量需要用到
安装完后添加环境变量,win + R 打开运行窗口,输入sysdm.cpl 或直接电脑属性->高级系统设置
或
查看是否安装成功:
运行窗口输入cmd执行tesseract -v
tesseract -v
出现版本号信息说明安装成功
文章来源地址https://www.toymoban.com/news/detail-600767.html
具体可参考Tesseract-OCR 下载安装和使用_半濠春水的博客-CSDN博客_tesseract-ocr下载
STEP3:python代码提取文字
文件目录:
test.jpg文件内容
python代码
from PIL import Image
import pytesseract
def demo():
image = Image.open('images/test.jpg')
# lang='chi_sim'是设置成中文识别
text = pytesseract.image_to_string(image,lang='chi_sim')
print(text)
if __name__ == "__main__":
demo()
执行python index.py
输出结果:
文章来源:https://www.toymoban.com/news/detail-600767.html
到了这里,关于python提取图片文字的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!