深度学习实战10-数学公式识别-将图片转换为Latex(img2Latex)

这篇具有很好参考价值的文章主要介绍了深度学习实战10-数学公式识别-将图片转换为Latex(img2Latex)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

大家好,我是微学AI,今天给大家带来一个关于数学公式识别的实战案例,解决大家在写论文中遇到很多latex输入的问题,而且可以无限次识别哦,因为是代码实现,不用调用外部API.

以前我们知道一个latex识别网页,latex识别网页神器:https://snip.mathpix.com/,但是这个识别是有次数限制的,我们如果需要大量的识别的话,这个是不适用的。这个功能识别效果准确率达98%,每个月可识别50次,识别pdf文件20页每月。识别效果:

深度学习实战10-数学公式识别-将图片转换为Latex(img2Latex)

今天我来大家实现一个用代码实现数学公式识别的Latexocr模型,实现数学公式识别,可支持一部分的数学手写功能。他是基于本地程序是完全免费的,可以无限次调用。

接下来我将会用两种方法进行latex识别,第二种方法支持中文和公式一起识别。

方法一:

官方地址:https://github.com/lukas-blecher/LaTeX-OCR/

文件结构:

深度学习实战10-数学公式识别-将图片转换为Latex(img2Latex)

运行程序之前,我们要下载训练好的权重参数文件weights.pth,可以私信发给大家,或者

download weights v0.0.1 to path '本地地址信息', 下载好的权重文件放在checkpoints 文件夹下面。

安装库脚本:pip3 install pix2tex[gui] -i https://pypi.tuna.tsinghua.edu.cn/simple some-package

安装好后,我们可以直接运行 gui.py,我们就可以直接通过截图识别啦。识别效果如下:

深度学习实战10-数学公式识别-将图片转换为Latex(img2Latex)

可以将latexOCR功能单独拿出,做批量识别。python pix2tex.py -f 123.png , 可加入你要识别的图片名称,可返回Latex结果。

方法二:

安装pix2text: pip install pix2text

启动以下代码;会自动下载权重参数。

from pix2text import Pix2Text

img_fp = 'gongshi6.png'
p2t = Pix2Text(analyzer_config=dict(model_name='mfd'))
outs = p2t(img_fp, resized_shape=600)  # 也可以使用 `p2t.recognize(img_fp)` 获得相同的结果

# 如果只需要识别出的文字和Latex表示,可以使用下面行的代码合并所有结果
only_text = '\n'.join([out['text'] for out in outs])

print(only_text)

图片样例:gongshi6.png

深度学习实战10-数学公式识别-将图片转换为Latex(img2Latex)

 识别结果:

$$
a\sin x+b\cos x={\sqrt{a^{2}+b^{2}}}\sin\left(x+a r c\tan{\frac{b}{a}}\right)
$$

深度学习实战10-数学公式识别-将图片转换为Latex(img2Latex)

该模型可以识别中文与公式结合的图片,后期会更加优化的。

有什么问题可以私信哦,后期有更多适用性的实战,敬请关注!

 往期作品:

深度学习实战项目

1.深度学习实战1-(keras框架)企业数据分析与预测

2.深度学习实战2-(keras框架)企业信用评级与预测

3.深度学习实战3-文本卷积神经网络(TextCNN)新闻文本分类

4.深度学习实战4-卷积神经网络(DenseNet)数学图形识别+题目模式识别

5.深度学习实战5-卷积神经网络(CNN)中文OCR识别项目

6.深度学习实战6-卷积神经网络(Pytorch)+聚类分析实现空气质量与天气预测

7.深度学习实战7-电商产品评论的情感分析

8.深度学习实战8-生活照片转化漫画照片应用

9.深度学习实战9-文本生成图像-本地电脑实现text2img

10.深度学习实战10-数学公式识别-将图片转换为Latex(img2Latex)

11.深度学习实战11(进阶版)-BERT模型的微调应用-文本分类案例

12.深度学习实战12(进阶版)-利用Dewarp实现文本扭曲矫正

13.深度学习实战13(进阶版)-文本纠错功能,经常写错别字的小伙伴的福星

14.深度学习实战14(进阶版)-手写文字OCR识别,手写笔记也可以识别了

15.深度学习实战15(进阶版)-让机器进行阅读理解+你可以变成出题者提问

16.深度学习实战16(进阶版)-虚拟截图识别文字-可以做纸质合同和表格识别

17.深度学习实战17(进阶版)-智能辅助编辑平台系统的搭建与开发案例

18.深度学习实战18(进阶版)-NLP的15项任务大融合系统,可实现市面上你能想到的NLP任务

19.深度学习实战19(进阶版)-ChatGPT的本地实现部署测试,自己的平台就可以实现ChatGPT

...(待更新)文章来源地址https://www.toymoban.com/news/detail-434901.html

到了这里,关于深度学习实战10-数学公式识别-将图片转换为Latex(img2Latex)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • [深度学习实战]基于PyTorch的深度学习实战(下)[Mnist手写数字图像识别]

    PyTorch——开源的Python机器学习库   首先感谢所有点开本文的朋友们!基于PyTorch的深度学习实战可能要告一段落了。本想着再写几篇关于 PyTorch神经网络深度学习 的文章来着,可无奈项目时间紧任务重,要求 短时间内出图并做好参数拟合 。所以只得转战 Matlab 编程,框架旧

    2024年02月16日
    浏览(44)
  • Keras深度学习实战(41)——语音识别

    语音识别( Automatic Speech Recognition , ASR ,或称语音转录文本)使声音变得\\\"可读\\\",让计算机能够\\\"听懂\\\"人类的语言并做出相应的操作,是人工智能实现人机交互的关键技术之一。在《图像字幕生成》一节中,我们已经学习了如何将手写文本图像转录为文本,在本节中,我们将利用

    2024年02月04日
    浏览(35)
  • 深度学习应用-WeNet语音识别实战01

    概括         本文对WeNet声音识别网络的Python API上介绍的Non-Streaming Usage和 Streaming-Usage分别做了测试,两者本质相同。API对应采样的声音帧率、声道都做了限制。效果还可以,但是部分吐字不清晰、有歧义的地方仍然不能识别清晰。 项目地址: GitHub - wenet-e2e/wenet: Production

    2024年02月12日
    浏览(48)
  • 【深度学习】 图像识别实战 102鲜花分类(flower 102)实战案例

    本文主要对牛津大学的花卉数据集flower进行分类任务,写了一个具有普适性的神经网络架构(主要采用ResNet进行实现),结合了pytorch的框架中的一些常用操作,预处理、训练、模型保存、模型加载等功能 在文件夹中有102种花,我们主要要对这些花进行分类任务 文件夹结构

    2024年02月06日
    浏览(39)
  • 人脸识别实战:使用Python OpenCV 和深度学习进行人脸识别

    首先简要讨论基于深度学习的面部识别的工作原理,包括“深度度量学习”的概念。 然后,我将帮助您安装实际执行人脸识别所需的库。 最后,我们将为静止图像和视频流实现人脸识别。 安装人脸识别库 ================================================================== 为了使用 Python 和

    2024年04月09日
    浏览(75)
  • 【深度学习实战】基于深度学习的图片风格快速迁移软件(Python源码+UI界面)

    摘要: 图像风格迁移(Image Style Transfer) 是一种将一张图像的风格应用到另一张图像上的技术。本文详细介绍了其实现的技术原理,同时给出完整的 Python 实现代码、训练好的Pt模型,并且通过 PyQT 实现了UI界面,更方便进行功能的展示。图片风格转换系统主要实现了3种风格

    2024年02月02日
    浏览(42)
  • 深度学习实战:基于TensorFlow与OpenCV的手语识别系统

    本期内容:基于TensorFlow与OpenCV的手语识别系统 实验环境: python(3.11.4) tensorflow(2.13.0) cv2(4.8.0) 下载地址:https://download.csdn.net/download/m0_68111267/88518189 这些是Python中的标准库及第三方库及其相关的模块。 具体来说,这个代码导入了以下库: Pandas:数据分析和数据处理库。 NumP

    2024年02月06日
    浏览(43)
  • 深度学习实战44-Keras框架下实现高中数学题目的智能分类功能应用

    大家好,我是微学AI ,今天给大家介绍一下深度学习实战44-Keras框架实现高中数学题目的智能分类功能应用,该功能是基于人工智能技术的创新应用,通过对数学题目进行智能分类,提供个性化的学习辅助和教学支持。该功能的实现可以通过以下步骤:首先,采集大量的高中数

    2024年02月15日
    浏览(44)
  • 手写数学公式识别领域最新论文CAN代码梳理,以及用自己的数据集训练

    Counting-Aware Network(CAN)-手写数学公式识别网络是好未来与白翔团队一起发布的一篇2022年的被ECCV收录的论文,该论文旨在缓解目前大部分基于注意力机制的手写数学公式识别算法在处理较长或者空间结构较复杂的数学公式时,容易出现的注意力不准确的情况。该论文通过将符号

    2024年02月07日
    浏览(28)
  • PyTorch 深度学习实战 | 基于 ResNet 的花卉图片分类

    “工欲善其事,必先利其器”。如果直接使用 Python 完成模型的构建、导出等工作,势必会耗费相当多的时间,而且大部分工作都是深度学习中共同拥有的部分,即重复工作。所以本案例为了快速实现效果,就直接使用将这些共有部分整理成框架的 TensorFlow 和 Keras 来完成开发

    2023年04月09日
    浏览(29)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包