Java调用tess4j完成 OCR 文字识别

7月前作者：daqinzl 分类：Toy博客阅读(36) 违法举报

这篇具有很好参考价值的文章主要介绍了Java调用tess4j完成 OCR 文字识别。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

1，新建 maven 工程

2，引入依赖
<dependency>
   <groupId>net.sourceforge.tess4j</groupId>
   <artifactId>tess4j</artifactId>
   <version>5.11.0</version>
</dependency>

3，安装 tesseract-ocr

下载地址https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-w64-setup-5.3.3.20231005.exe

其他版本可以查看 https://digi.bib.uni-mannheim.de/tesseract/

安装过程中一直点下一步，建议取消语言包选项，后面手动下载

可能需要安装visual c++ 2015-2019 redistributable或最新版visual c++ 2015-2022 redistributable

4，下载语言包
https://digi.bib.uni-mannheim.de/tesseract/tessdata_fast/

下载enm.traineddata和chi_sim.traineddata，复制粘贴到C:\Program Files\Tesseract-OCR\tessdata

5，调用 Tesseract API 完成文本识别

import java.io.File;

import net.sourceforge.tess4j.Tesseract;

public class Tess4jDemo {

   public static void main(String[] args) {
       // 创建实例
       Tesseract instance = new Tesseract();

       // 设置语言包路径
       instance.setDatapath("C:\\Program Files\\Tesseract-OCR\\tessdata");

       // 设置语言
       instance.setLanguage("chi_sim");

       // 设置文本文件
       File file = new File("C:\\Users\\user1\\Desktop\\截图.PNG");

       try {
           // 文本识别
           String result = instance.doOCR(file);
           System.out.println(result);
       } catch (Exception e) {
           e.printStackTrace();
       }
   }

}

示例代码见

https://download.csdn.net/download/daqinzl/89221358文章来源地址https://www.toymoban.com/news/detail-857923.html

到了这里，关于Java调用tess4j完成 OCR 文字识别的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

【uniapp】调用阿里云OCR图片识别文字：

一、效果：二、实现：【阿里官方】高精版OCR文字识别【最新版】-云市场-阿里云

2024年01月23日
浏览(37)
Python调用微信OCR识别文字和坐标

在看雪看到一篇文章：逆向调用QQ截图NT与WeChatOCR-软件逆向。里面说了怎么调用微信和QQ本地的OCR模型，还有很详细的分析过程。我稍微看了下文章，多的也看不懂。大概流程是使用mmmojo.dll这个dll来与WeChatOCR.exe做通信的，也是用它来启动和关闭WeChatOCR.exe进程的。所以关键只

2024年04月15日
浏览(45)
[C#]调用tesseact-ocr的traineddata模型进行ocr文字识别

【框架地址】 https://github.com/charlesw/tesseract 【算法介绍】 Tesseract OCR是一个开源的光学字符识别引擎，它可以将图像中的文字转换成可编辑和可搜索的文本格式。Tesseract由惠普实验室于1985年开始开发，并在2005年被Google收购后成为了开源项目。自那时起，它一直在不断的更新和

2024年02月02日
浏览(43)
【OCR项目】之用HALCON的深度学习工具进行文字识别，并导出到C++调用

HALCON是一个强大的机器视觉工具，包含了2D，3D图像各种算子，以及各种任务的深度学习工具，包括目标检测，实例分割，文字识别等。这次从实际生产的角度，来分享一下如何用HALCON进行文字识别。衡量一个技术是否能在实际工业生产使用，要考虑的因素：最重要的一点，

2024年01月22日
浏览(52)
【项目管理】Java OCR实现图片文字识别

系统：Win10 Java：1.8.0_333 IDEA：2020.3.4 最近在看外国漫画的时候，发现有些漫画没有汉化的翻译，这哪看得懂。正想把那些日语输入到有道翻译一下，发现日文不会输。正巧之前有接触关于OCR的项目，所以便想用Java做一个小工具，实现图片的文字识别功能，于是我便开始了项目

2024年02月02日
浏览(40)
通用文字识别本地OCR接口 json数据任意语言不限次调用 exe服务工具免搭建部署启动即用

在这里插入图片描述样本识别效果：使用方法: 启动本地OCR接口服务图片文件=base64编码=转json格式=传到对应接口本地OCR程序：文件太大没法传，要会员，我刚删掉了一个复杂模型，能用上得再问我要把。微：huang582716403

2024年02月11日
浏览(61)
java使用tesseract-ocr进行文字识别

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档公司使用AI进行OCR文字识别效果不好，并且提供的服务不稳定，本次查找到使用java也能连接的OCR开源项目进行识别的学习 tesseract-ocr是一个开源的OCR文字识别项目，目前版本已经更新到5.X.X了，并且提供

2024年02月04日
浏览(44)
【实操】Java+百度ocr，实现图片识别文字小工具

图片识别文字，咱用java也可以通过 java+百度ocr ，实现一个截图或上传图片，图片识别文字的小工具。并通过 exe4j工具将jar包封装成exe可执行桌面文件，方便使用及学习。一位特别的老友即将在2023年10月26日年满 30周岁，愿平安喜乐公众号：【JavaDog程序狗】关注公众号

2024年02月08日
浏览(48)
OCR文字识别技术

OCR全称是optical character recognition，中文光学字符识别。主要技术是：把图像形状转变为文本字符。简单来说，OCR技术就是通过图像处理和模式识别技术对光学的字符进行识别，即，对文本资料进行扫描，然后对图像文件进行分析处理，获取文字及版面信息的过程。 OCR 支持各

2024年02月08日
浏览(45)
Python实现OCR文字识别

OCR（Optical Character Recognition，光学字符识别）是指通过扫描纸质文档或照片，通过计算机对图像记录的文字进行识别的一种技术。本文介绍如何使用Python来实现OCR文字识别技术。要实现Python的OCR文字识别，首先需要安装OCR软件和相关的包依赖，比如pytesseract和OpenCV。安装pyt

2024年02月16日
浏览(38)