深度学习实战10-数学公式识别-将图片转换为Latex(img2Latex)

这篇具有很好参考价值的文章主要介绍了深度学习实战10-数学公式识别-将图片转换为Latex(img2Latex)。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

大家好，我是微学AI，今天给大家带来一个关于数学公式识别的实战案例，解决大家在写论文中遇到很多latex输入的问题，而且可以无限次识别哦，因为是代码实现，不用调用外部API.

以前我们知道一个latex识别网页，latex识别网页神器：https://snip.mathpix.com/，但是这个识别是有次数限制的，我们如果需要大量的识别的话，这个是不适用的。这个功能识别效果准确率达98%，每个月可识别50次，识别pdf文件20页每月。识别效果：

深度学习实战10-数学公式识别-将图片转换为Latex(img2Latex)

今天我来大家实现一个用代码实现数学公式识别的Latexocr模型，实现数学公式识别，可支持一部分的数学手写功能。他是基于本地程序是完全免费的，可以无限次调用。

接下来我将会用两种方法进行latex识别，第二种方法支持中文和公式一起识别。

方法一：

官方地址：https://github.com/lukas-blecher/LaTeX-OCR/

文件结构：

深度学习实战10-数学公式识别-将图片转换为Latex(img2Latex)

运行程序之前，我们要下载训练好的权重参数文件weights.pth，可以私信发给大家，或者

download weights v0.0.1 to path '本地地址信息'，下载好的权重文件放在checkpoints 文件夹下面。

安装库脚本：pip3 install pix2tex[gui] -i https://pypi.tuna.tsinghua.edu.cn/simple some-package

安装好后，我们可以直接运行 gui.py，我们就可以直接通过截图识别啦。识别效果如下：

深度学习实战10-数学公式识别-将图片转换为Latex(img2Latex)

可以将latexOCR功能单独拿出，做批量识别。python pix2tex.py -f 123.png , 可加入你要识别的图片名称，可返回Latex结果。

方法二：

安装pix2text: pip install pix2text

启动以下代码；会自动下载权重参数。

from pix2text import Pix2Text

img_fp = 'gongshi6.png'
p2t = Pix2Text(analyzer_config=dict(model_name='mfd'))
outs = p2t(img_fp, resized_shape=600)  # 也可以使用 `p2t.recognize(img_fp)` 获得相同的结果

# 如果只需要识别出的文字和Latex表示，可以使用下面行的代码合并所有结果
only_text = '\n'.join([out['text'] for out in outs])

print(only_text)

图片样例：gongshi6.png

深度学习实战10-数学公式识别-将图片转换为Latex(img2Latex)