Paddle OCR 安装使用教程

这篇具有很好参考价值的文章主要介绍了Paddle OCR 安装使用教程。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

一、简介

PaddleOCR是飞浆开源文字识别模型,最新开源的超轻量PP-OCRv3模型大小仅为16.2M。同时支持中英文识别;支持倾斜、竖排等多种方向文字识别;支持GPU、CPU预测,并且支持使用paddle开源组件训练自己的超轻量模型,对于垂直领域的需求有很大帮助。

二、使用教程

  1. 环境安装
  • 说明:官方推荐使用python3.7以上版本,但是在实际安装使用中发现python3.8更稳定,如果本地python安装包过多,推荐使用Anaconda来进行python包管理,避免包冲突。
  • Anaconda下载:
    地址:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/?C=M&O=D
    按需下载自己需要的版本
  1. 安装程序运行所需库
  • 安装paddle

    pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple
    

    默认安装CPU版本,安装paddle时建议使用百度源,若需要安装GPU版本,则请打开paddle官网选择适合的版本.

    paddle官网:https://www.paddlepaddle.org.cn/
    由于安装GPU版本需要先配置好CUDA和cudnn,建议有一定基础后再安装GPU版本

  • 安装paddlehub

    pip install paddlehub -i https://mirror.baidu.com/pypi/simple
    

    paddlehub介绍文档:https://github.com/PaddlePaddle/PaddleHub/blob/release/v2.1/README_ch.md

    对于Windows环境用户:直接通过pip安装的shapely库可能出现 找不到指定模块的问题。建议从下方地址下载shapely安装包完成安装
    https://www.lfd.uci.edu/~gohlke/pythonlibs/#shapely

  1. 安装ocr模型

     hub install ch_pp-ocrv3==1.2.0
    
    模型名称 ch_pp-ocrv3
    网络 Differentiable Binarization+SVTR_LCNet
    数据集 icdar2015数据集
    是否支持Fine-tuning
    模型大小 13M
    最新更新日期 2022-05-11

    其它模型: chinese_ocr_db_crnn_server、PP-OCR、PP-OCRv2

三、模型调用

  1. 命令行预测示例

    hub run ch_pp-ocrv3 --input_path "/PATH/TO/IMAGE"
    
  2. python代码示例

    import paddlehub as hub
    import cv2
    
    img_path = r'C:\Users\26414\Downloads\test.jpg'
    
    ocr = hub.Module(name="ch_pp-ocrv3", enable_mkldnn=True)       # mkldnn加速仅在CPU下有效
    result = ocr.recognize_text(images=[cv2.imread(img_path)])
    
    # or 传递文件地址调用
    # result = ocr.recognize_text(paths=[img_path])
    

    注: img_path路径中不能包含中文字符,opencv不支持中文路径

    参数

    • paths (list[str]): 图片的路径;
    • images (list[numpy.ndarray]): 图片数据,ndarray.shape 为 [H, W, C],BGR格式;
    • use_gpu (bool): 是否使用 - GPU;若使用GPU,请先设置CUDA_VISIBLE_DEVICES环境变量
    • box_thresh (float): 检测文本框置信度的阈值;
    • text_thresh (float): 识别中文文本置信度的阈值;
    • angle_classification_thresh(float): 文本角度分类置信度的阈值
    • visualization (bool): 是否将识别结果保存为图片文件;
    • output_dir (str): 图片的保存路径,默认设为 ocr_result;
    • det_db_unclip_ratio: 设置检测框的大小;

    返回

    • res (list[dict]): 识别结果的列表,列表中每一个元素为 dict,各字段为:
      • data (list[dict]): 识别文本结果,列表中每一个元素为 dict,各字段为: - text(str): 识别得到的文本 - confidence(float): 识别文本结果置信度 - text_box_position(list): 文本框在原图中的像素坐标,4*2的矩阵,依次表示文本框左下、右下、右上、左上顶点的坐标 如果无识别结果则data为[]
      • save_path (str, optional): 识别结果的保存路径,如不保存图片则save_path为’’

四、效果展示

  • 测试图片
    Paddle OCR 安装使用教程,图像识别,python,ocr,paddle

  • 结果展示
    Paddle OCR 安装使用教程,图像识别,python,ocr,paddle

注:
目前paddle ocr最高版本已更新只pp-ocr-v4,cpu环境下不推荐使用该版本,相比pp-ocr-v3效果虽然略有提升,但是速度要慢很多,且不支持cpu加速

参考文档
paddle ocr官方地址: https://www.paddlepaddle.org.cn/hubdetail?name=ch_pp-ocrv3&en_category=TextRecognition
paddle ocr GitHub地址: https://github.com/PaddlePaddle/PaddleHub
在线体验地址: https://www.paddlepaddle.org.cn/hub/scene/ocr

查看其他开源中文OCR,点击此处
Docker中部署PaddleOCR,点击此处文章来源地址https://www.toymoban.com/news/detail-552581.html

到了这里,关于Paddle OCR 安装使用教程的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • fastdeploy部署多线程/进程paddle ocr(python flask框架 )

    部署参考:https://github.com/PaddlePaddle/FastDeploy/blob/develop/tutorials/multi_thread/python/pipeline/README_CN.md 安装 cpu: pip install fastdeploy-python gpu : pip install fastdeploy-gpu-python 命令: 多线程 多进程 文件:multi_thread_process_ocr.py 原始代码:270行 修改为如下,去掉1 因为安装包不对,fastdeploy与

    2024年02月11日
    浏览(39)
  • [软件工具]pdf多区域OCR识别导出excel工具使用教程

    首先我们打开软件,界面如下: 如上图,使用非常简单,步骤如下: (1)选择工具-取模板选择一个pdf文件划定自己需要识别的区域,如果你选择第2页指定区域则软件统一识别所有pdf第2页指定区域,划定区域后需要添加区域,最后保存模板,这样下次启动软件无需再次取模

    2024年01月18日
    浏览(35)
  • Halcon图像的 OCR 识别&训练字符

    处理图像使得数字或是字母为白底黑字-创建字符识别句柄-识别-清除句柄        算子:read_ocr_class_mlp( : : FileName : OCRHandle) 示例:read_ocr_class_mlp (\\\'Document_0-9A-Z_NoRej.omc\\\', OCRHandle) \\\'Document_0-9A-Z_NoRej.omc\\\'(输入控制参数):输入识别类型 OCRHandle(输出控制参数): 输出识别句

    2024年02月12日
    浏览(40)
  • OCR字符识别:选择合适的图像裁剪方式

          OCR字符识别是一项重要的技术,可以将图片中的文本内容转化为可编辑的文字。在实际应用中,常常需要对大量的图片进行识别操作,比如身份证信息批量识别。本文将介绍一种选择合适的图像裁剪方式来提高OCR字符识别的准确性与效率。 一、API接口概述 挖数据平台

    2024年02月02日
    浏览(45)
  • 67、C#调用Visual Studio 2019生成的Paddle+OCR(使用ncnn库),去完成业务任务

    基本思想:这里使用飞哥写的android代码,将其取出纯c++代码逻辑,自己尝试转了paddle+ocr模型,可以成功转换,不在详细阐述生成ncnn模型的过程和写后处理ocr识别过程,这里要实现的目的是使用c#调用ncnn的ocr工程,完成对应部门的业务支撑~ 一、在window10+ncnn+clion+mingw32测试结

    2024年02月09日
    浏览(57)
  • 【OpenCV+OCR】计算机视觉:识别图像验证码中指定颜色文字

    【作者主页】: 吴秋霖 【作者介绍】:Python领域优质创作者、阿里云博客专家、华为云享专家。长期致力于Python与爬虫领域研究与开发工作! 【作者推荐】:对JS逆向感兴趣的朋友可以关注《爬虫JS逆向实战》,对分布式爬虫平台感兴趣的朋友可以关注《分布式爬虫平台搭建

    2024年02月05日
    浏览(52)
  • Python实现OCR文字识别

    OCR(Optical Character Recognition,光学字符识别)是指通过扫描纸质文档或照片,通过计算机对图像记录的文字进行识别的一种技术。本文介绍如何使用Python来实现OCR文字识别技术。 要实现Python的OCR文字识别,首先需要安装OCR软件和相关的包依赖,比如pytesseract和OpenCV。 安装pyt

    2024年02月16日
    浏览(36)
  • python之OCR文字识别

    将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR)。可以实现OCR 的底层库并不多,目前很多库都是使用共同的几个底层OCR 库,或者是在上面进行定制。 easyocr是基于torch的深度学习模块 easyocr安装后调用过程中出现opencv版本不兼容问题,所以放弃此方案

    2024年02月20日
    浏览(39)
  • 【Python】【OpenCV】OCR识别(三)——字符识别

    通过上一篇博客,我们成功将有角度的图片进行“摆正”,接下来我们来提取图片中的文字。 我们使用Tesseract来处理图片并提取文字,相关下载安装请参考:Python下Tesseract Ocr引擎及安装介绍 - 黯然销魂掌2015 - 博客园 (cnblogs.com) 同时我们需要下载第三方Lib——pytesseract,使用

    2024年02月02日
    浏览(45)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包