深度学习系列59：文字识别

9月前作者：IE06 分类：Toy博客阅读(34) 违法举报

这篇具有很好参考价值的文章主要介绍了深度学习系列59：文字识别。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

1. 简单文本：

使用google加的tesseract，效果不错。
首先安装tesseract，在mac直接brew install即可。
python调用代码：

import pytesseract
from PIL import Image
img = Image.open('1.png')
pytesseract.image_to_string(img, lang='chi_sim+eng')

2. 结构化文本

使用百度家的paddleocr可以达成如下效果：
深度学习系列59：文字识别,深度学习系列,深度学习,人工智能

安装方法：pip install “paddleocr>=2.2”，调用代码。
其中画图的部分如果要用的话，需要下载字体库：!git clone https://gh.api.99988866.xyz/https://github.com/PaddlePaddle/PaddleOCR；不需要画图的话，注释掉即可。文章来源地址https://www.toymoban.com/news/detail-836091.html

import os
import cv2
from paddleocr import PPStructure, draw_structure_result, save_structure_res
from PIL import Image


def Structure_analysis(img_path):
    table_engine = PPStructure(show_log=True)
    save_folder = './output/table'
    img = cv2.imread(img_path)
    result = table_engine(img)1
    save_structure_res(result, save_folder,os.path.basename(img_path).split('.')[0])

    for line in result:
        line.pop('img')
        print(line)

    font_path = '../PaddleOCR/doc/fonts/simfang.ttf' # PaddleOCR下提供字体包
    image = Image.open(img_path).convert('RGB')
    im_show = draw_structure_result(image, result, font_path=font_path)
    im_show = Image.fromarray(im_show)
    im_show.save('result.jpg')
    pass

Structure_analysis('1.png')

到了这里，关于深度学习系列59：文字识别的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

毕业设计选题-基于深度学习的吸烟检测识别系统人工智能机器学习 YOLO

目录前言课题背景和意义实现技术思路一、吸烟检测方法 1.1 网络总体结构 1.2 CotNet Transformer 模块二、数据集三、实验及结果分析 3.1 实验环境搭建 3.2 结果分析实现效果图样例最后 📅大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就

2024年01月20日
浏览(100)
人工智能概论报告-基于PyTorch的深度学习手写数字识别模型研究与实践

本文是我人工智能概论的课程大作业实践应用报告，可供各位同学参考，内容写的及其水，部分也借助了gpt自动生成，排版等也基本做好，大家可以参照。如果有需要word版的可以私信我，或者在评论区留下邮箱，我会逐个发给。word版是我最后提交的，已经调整统一了全文格

2024年02月05日
浏览(73)
ocr、人工智能、文字识别接口

人工智能这个词近几年热度颇高，工业上有人称之为“机器代工”，生活中有人称之为“物联网”，而所体现出来的就是智能化，减少人工参与。翔云公有云平台应运而生，提供的OCR API及实名认证API使产品智能化，自动进行图片文字识别及身份证、手机号、银行卡、发票等信

2024年04月26日
浏览(44)
(九)人工智能应用--深度学习原理与实战--前馈神经网络实现MNST手写数字识别

目标: 识别手写体的数字，如图所示: 学习内容: 1、掌握MNIST数据集的加载和查看方法 2、熟练掌握Keras建立前馈神经网络的步骤【重点】 3、掌握模型的编译及拟合方法的使用，理解参数含义【重点】 4、掌握模型的评估方法 5、掌握模型的预测方法 6、掌握自定义图片的处理与

2024年02月13日
浏览(48)
毕业设计选题-基于深度学习的车道线检测算法识别系统人工智能机器学习卷积神经网络

目录前言课题背景和意义实现技术思路一、车道线检测方法 1.1 卷积神经网络 1.2 注意力机制二、数据集三、实验及结果分析 3.1 实验环境搭建 3.2 模型训练实现效果图样例最后 📅大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学

2024年02月22日
浏览(79)
【毕业设计】基于深度学习的道路裂缝识别算法系统 python 卷积神经网络人工智能

目录前言设计思路一、课题背景与意义二、算法理论原理 2.1 卷积神经网络 2.1 YOLOv5算法三、道路裂缝检测的实现 3.1 数据集 3.2 实验环境及参数设置 3.2 实验及结果分析实现效果图样例最后 📅大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后

2024年03月24日
浏览(86)
毕业设计-基于深度学习玉米叶病虫害识别系统 YOLO python 机器学习目标检测人工智能算法

目录前言设计思路一、课题背景与意义二、算法理论原理 2.1 卷积神经网络 2.2 YOLOv5算法三、检测的实现 3.1 数据集 3.2 实验环境搭建 3.3 实验及结果分析实现效果图样例最后 📅大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准

2024年02月03日
浏览(135)
毕业设计选题-计算机视觉：复杂场景下的车牌识别系统人工智能深度学习 YOLO

目录前言项目背景与简介主要设计思路一、算法理论技术 1.1 神经网络基础 1.2 深度神经网络 1.3 目标检测二、数据处理 2.1 数据采集三、实现的效果更多帮助 📅大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准备,一边要为毕业设

2024年02月03日
浏览(101)
AI人工智能课题：通用场景文字识别系统的设计与实现（基于百度智能云AI接口）

博主介绍：黄菊华老师《Vue.js入门与商城开发实战》《微信小程序商城开发》图书作者，CSDN博客专家，在线教育专家，CSDN钻石讲师；专注大学生毕业设计教育和辅导。所有项目都配有从入门到精通的基础知识视频课程，免费项目配有对应开发文档、开题报告、任务书、

2024年02月05日
浏览(74)
AI人工智能课题：财务票据文字识别系统的设计与实现（基于百度智能云AI接口）

博主介绍：黄菊华老师《Vue.js入门与商城开发实战》《微信小程序商城开发》图书作者，CSDN博客专家，在线教育专家，CSDN钻石讲师；专注大学生毕业设计教育和辅导。所有项目都配有从入门到精通的基础知识视频课程，免费项目配有对应开发文档、开题报告、任务书、

2024年02月04日
浏览(52)