rapid_latex_ocr: 更快更好用的公式图像转latex工具

这篇具有很好参考价值的文章主要介绍了rapid_latex_ocr: 更快更好用的公式图像转latex工具。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

Rapid Latex OCR

rapid_latex_ocr: 更快更好用的公式图像转latex工具,RapidAI,工具,ocr,image-to-text

  • rapid_latex_ocr是一个将公式图像转为latex格式的工具。
  • 仓库中的推理代码改自LaTeX-OCR,模型已经全部转为ONNX格式,并对推理代码做了精简,推理速度更快,更容易部署。
  • 仓库只有基于ONNXRuntime或者OpenVINO推理onnx格式的代码,不包含训练模型代码。如果想要训练自己的模型,请移步LaTeX-OCR。
  • 如果有帮助到您的话,请给个小星星⭐或者赞助一杯咖啡(点击页面最上面的Sponsor中链接)
  • 欢迎各位小伙伴积极贡献,让这个工具更好。

使用

  1. 安装

    1. pip安装rapid_latext_ocr库。因将模型打包到whl包中超出pypi限制(100M),因此需要单独下载模型。

      pip install rapid_latex_ocr
      
    2. 下载模型(Google Drive | 百度网盘),初始化时,指定模型路径即可,详细参见下一部分。

      模型名称 大小
      image_resizer.onnx 37.1M
      encoder.onnx 84.8M
      decoder.onnx 48.5M
  2. 使用

    • 脚本使用:
      from rapid_latex_ocr import LatexOCR
      
      image_resizer_path = 'models/image_resizer.onnx'
      encoder_path = 'models/encoder.onnx'
      decoder_path = 'models/decoder.onnx'
      tokenizer_json = 'models/tokenizer.json'
      model = LatexOCR(image_resizer_path=image_resizer_path,
                      encoder_path=encoder_path,
                      decoder_path=decoder_path,
                      tokenizer_json=tokenizer_json)
      
      img_path = "tests/test_files/6.png"
      with open(img_path, "rb") as f:
          data = f.read()
      
      result, elapse = model(data)
      
      print(result)
      # {\frac{x^{2}}{a^{2}}}-{\frac{y^{2}}{b^{2}}}=1
      
      print(elapse)
      # 0.4131628000000003
      
    • 命令行使用
      $ rapid_latex_ocr -h
      usage: rapid_latex_ocr [-h] [-img_resizer IMAGE_RESIZER_PATH]
                          [-encdoer ENCODER_PATH] [-decoder DECODER_PATH]
                          [-tokenizer TOKENIZER_JSON]
                          img_path
      
      positional arguments:
      img_path              Only img path of the formula.
      
      optional arguments:
      -h, --help            show this help message and exit
      -img_resizer IMAGE_RESIZER_PATH, --image_resizer_path IMAGE_RESIZER_PATH
      -encdoer ENCODER_PATH, --encoder_path ENCODER_PATH
      -decoder DECODER_PATH, --decoder_path DECODER_PATH
      -tokenizer TOKENIZER_JSON, --tokenizer_json TOKENIZER_JSON
      
      $ rapid_latex_ocr tests/test_files/6.png \
          -img_resizer models/image_resizer.onnx \
          -encoder models/encoder.onnx \
          -dedocer models/decoder.onnx \
          -tokenizer models/tokenizer.json
      # ('{\\frac{x^{2}}{a^{2}}}-{\\frac{y^{2}}{b^{2}}}=1', 0.47902780000000034)
      
  3. 输入输出说明文章来源地址https://www.toymoban.com/news/detail-593835.html

    • 输入(Union[str, Path, bytes]):只含有公式的图像。
    • 输出(Tuple[str, float])(识别结果, 耗时), 具体参见下例:
      (
         '{\\frac{x^{2}}{a^{2}}}-{\\frac{y^{2}}{b^{2}}}=1',
         0.47902780000000034
      )
      

详情,可移步:RapidLatexOCR

到了这里,关于rapid_latex_ocr: 更快更好用的公式图像转latex工具的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • word中使用latex多行公式,矩阵公式

    的引起的那条竖线可以通过backspace或者delete删除

    2024年01月21日
    浏览(29)
  • word将mathtype公式批量转为latex公式

    最近,由于工作学习需要,要将word里面的mathype公式转为latex公式。 查了查资料,有alt+的操作,这样太慢了。通过下面链接的操作,结合起来可以解决问题。 某乎:https://www.zhihu.com/question/532353646 csdn:https://blog.csdn.net/m0_52232795/article/details/130617795 某乎比较详细,但是配合c

    2024年02月13日
    浏览(35)
  • latex行间插入公式

    1、 插入公式 : 行内公式 :  $公式$ ,例子: $frac{L^4}{2}+frac{L^3}{6}-frac{4L}{3}$ ; 行间公式(自带公式编号) , begin{equation}公式end{equation} ,例子: begin{equation} frac{L^4}{2}+frac{L^3}{6}-frac{4L}{3} end{equation} ; 无编号行间公式 :也可以使用  begin{displaymath} ... end{displaymat

    2024年02月07日
    浏览(37)
  • 【Latex 写作】数学公式

    单层分式: 分子 over 分母 。如: 编译为 a + 1 b + 1 a+1 over b+1 b + 1 a + 1 ​ 多层分式: frac {分子} {分母} 。如: 编译为 a b + 1 c + 2 d + 4 + 8 frac {frac ab +1} {frac {c+2}{d+4} +8} d + 4 c + 2 ​ + 8 b a ​ + 1 ​ 根式: sqrt [根指数] {被开方数} ,缺省根指数时默认为 2。如: 编译为 x + y

    2024年02月08日
    浏览(53)
  • Latex数学公式排版

    The not so short introduction to latex各种语言版本下载地址 空格和分段: 空格键和Tab 键输入的空白字符视为“空格”。连续的若干个空白字符视 为一个空格。一行开头的空格忽略不计 多个空行被视为一个空行。也可以在行末使用 par 命令分段。 注释: % 特殊字符: # $ % 等等,均需转义

    2023年04月23日
    浏览(36)
  • 【idea性能篇】性能稳定、更好用的idea

    工欲善其事,必先利其器。idea作为Java程序员们工作中,打交道最多的软件,如果有过大量微服务项目同时开启开发的经验的程序员,想必会对idea是又爱又恨,过高的内存占用,运行时间长后idea响应迟钝,甚至无响应,简直令人抓狂。下面我们来让我们的idea变得更加好用吧

    2024年02月08日
    浏览(33)
  • latex2【图片、公式、矩阵】

    图片 语法: 看起来很别扭是吧,需要进行“修饰”: 当然,这样也很丑,一般写论文可以用以下的格式: 多张图片排版: 公式: 行内公式: 行间公式 上下标: 公式中的希腊字母 数学函数 根式 分式 自动编号与非自动编号 矩阵: 导包: 分块矩阵: 三角矩阵 这一个也不

    2024年02月17日
    浏览(33)
  • 【LaTex】矩阵、向量、单边公式排列

    1.1 matrix语法 写矩阵和向量都可以有多种语法,其中 matrix 语法比较简单,可以直接使用,基本的语法如下: e l e m 1 e l e m 2 e l e m 3 e l e m 4 begin{matrix} elem1 elem2 \\\\ elem3 elem4 end{matrix} e l e m 1 e l e m 3 ​ e l e m 2 e l e m 4 ​ 可以看到,我们生成了按照矩阵排列的四个元素,其中 表

    2024年02月10日
    浏览(33)
  • WPS内插入latex公式

    Step1:下载CTEX:https://ctex.org/ctex/download/ CTeX_3.0.215.2.exe: 32/64位通用版本 CTeX_3.0.215.2_x86.exe: 32位专用版本 CTeX_3.0.215.2_x64.exe: 64位专用版本 完整版(包含 MiKTeX 完整安装和中文常用宏包) CTeX_3.0.215.2_Full.exe: 32/64位通用版本,须下载同名的 nsisbin 文件并放在同一目录下 CTeX_3.0.215.2_

    2024年02月10日
    浏览(32)
  • Latex 公式 合并行与列

    latex 编辑公式时需要合并行与列 使用 multirow 和 multicolumn The multirow, bigstrut and bigdelim packages Vertical Alignment in multirow using cells with 1 lines

    2024年02月22日
    浏览(31)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包