C#实战:基于腾讯OCR技术实现企业证书识别和数据提取实践

这篇具有很好参考价值的文章主要介绍了C#实战:基于腾讯OCR技术实现企业证书识别和数据提取实践。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

C#实战:基于腾讯OCR技术实现企业证书识别和数据提取实践,评测,Net,c#,ocr,人工智能,腾讯云,原力计划

一、OCR技术介绍

在当今数字化时代,OCR(Optical Character Recognition)识别技术正发挥着越来越重要的作用。OCR技术通过将图像中的文字转化为可编辑的文本形式,实现了对大量纸质文档的数字化处理和信息提取。常见的有企业资质证书的识别到身份证、护照等各类证件的自动识别等方面,OCR技术正在为各行各业无纸化办公起到了非常重要的作用。

二、OCR技术的工作过程

OCR(Optical Character Recognition)技术的原理是通过将图像中的文字转化为可编辑的文本形式。下面是OCR技术的基本原理步骤:

图像预处理:对输入的图像进行预处理。这包括去除图像中的噪声、调整图像的亮度和对比度,以及对图像进行二值化处理,将文字区域与背景区域分离。

文字检测:在预处理后的图像中,使用文字检测算法来识别出文字的位置和边界框。常用的文字检测算法包括基于边缘检测、区域生长、模板匹配等方法。

字符分割:对于检测到的文字区域,需要将每个字符进行分割,以便单独处理。字符分割算法可以根据字符之间的间距、连通性和像素密度等特征进行处理。

特征提取:对于每个字符,需要提取出其特征,以便与已知的字符进行比较和匹配。常用的特征提取方法包括基于形状、纹理、投影等的特征描述。

字符识别:通过将提取的字符特征与预先训练好的模型进行比较,来识别每个字符。常用的字符识别方法包括基于模板匹配、统计模型(如隐马尔可夫模型)和深度学习模型(如卷积神经网络)等。

后处理:在字符识别后,可以进行一些后处理步骤来提高识别结果的准确性。这包括纠正错误、去除冗余字符、校正文字方向等。

三、腾讯云文字识别介绍

腾讯云文字识别(Optical Character Recognition,OCR )基于行业前沿的深度学习技术,将图片上的文字内容智能识别成为可编辑的文本。支持通用文字、卡证文字、票据单据、特定场景等多场景下的印刷体、手写体文字识别,同时支持票据核验功能,支持提供定制化服务,可以有效地代替人工录入信息。

C#实战:基于腾讯OCR技术实现企业证书识别和数据提取实践,评测,Net,c#,ocr,人工智能,腾讯云,原力计划

腾讯云文字识别支持多种开发语言集成、案例丰富、接口稳定性强对于开发人员非常容易上抽,快速集成文字识别的需求。

四、腾讯云文字识别功能特点

多种识别能力:腾讯云文字识别服务支持多种文字识别能力,包括通用文字识别、身份证识别、银行卡识别、车牌识别、名片识别、手写体识别等。这些能力可以满足不同场景下的文字识别需求。

高精度识别:腾讯云文字识别服务基于深度学习技术,具备较高的文字识别准确率。它可以识别出图像中的文字内容,并提供可编辑的文本结果,以便后续处理和分析。

多语言支持:腾讯云文字识别服务支持多种常见语言的文字识别,包括中文、英文、中英文、日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语,阿拉伯语20种语言。这使得它可以应用于不同语言环境下的文字识别任务。

图片格式支持:腾讯云文字识别服务支持多种常见的图片格式,包括JPEG、PNG、BMP等。这使得它可以处理不同格式的图像文件,方便开发者进行文字识别操作。

简单易用的API接口:腾讯云文字识别服务提供简单易用的API接口,开发者只需按照文档说明进行请求和解析即可实现文字识别功能。这使得开发者可以快速集成和使用该服务。

可扩展性和稳定性:作为腾讯云的云服务,文字识别服务具有良好的可扩展性和稳定性。它可以根据实际需求进行弹性扩容,并提供高可用性和可靠性的服务保障。

五、集成案例

今天小编就来给给大家介绍一下腾讯云OCR服务并且通过C#代码实现企业资质证书的快速识别功能。

5.1 开通服务

需要登录自己的腾讯云账户,可以使用微信扫码登录。然后进入腾讯云的OCR主页。

OCR主页:https://cloud.tencent.com/product/ocr

C#实战:基于腾讯OCR技术实现企业证书识别和数据提取实践,评测,Net,c#,ocr,人工智能,腾讯云,原力计划

点击立即使用按钮进入开通服务页面

C#实战:基于腾讯OCR技术实现企业证书识别和数据提取实践,评测,Net,c#,ocr,人工智能,腾讯云,原力计划

然后我们点击开通服务,等待开通完成,进入管理控制台。

C#实战:基于腾讯OCR技术实现企业证书识别和数据提取实践,评测,Net,c#,ocr,人工智能,腾讯云,原力计划

服务开通后,进入OCR API调试页面,可以进行测试确认服务是否正常

访问地址:

https://console.cloud.tencent.com/api/explorer?Product=ocr&Version=2018-11-19&Action=BizLicenseOC

下图展示接口调用是正常的。右侧可以看到支持主流的开发语言比如:Java、Net、PHP、Python、C++、Golang。

C#实战:基于腾讯OCR技术实现企业证书识别和数据提取实践,评测,Net,c#,ocr,人工智能,腾讯云,原力计划

5.2 申请个人密钥

然后申请个人的API密钥,这个是系统集成服务必备的环节。

访问地址:

https://console.cloud.tencent.com/cam/capi

可以点击新建密钥,然后创建成功后,如下图展示效果:

C#实战:基于腾讯OCR技术实现企业证书识别和数据提取实践,评测,Net,c#,ocr,人工智能,腾讯云,原力计划

5.3 代码集成

这里使用Net方式集成,首先使用VS2019创建一个Net控制台应用。

C#实战:基于腾讯OCR技术实现企业证书识别和数据提取实践,评测,Net,c#,ocr,人工智能,腾讯云,原力计划

创建完成后,引用腾讯云OCR服务的依赖包,这里直接使用nuget直接搜索安装。

方法:打开nuget包管理器,输入 “TencentCloudSDK.Ocr” 进行搜索,然后点击安装即可 。

C#实战:基于腾讯OCR技术实现企业证书识别和数据提取实践,评测,Net,c#,ocr,人工智能,腾讯云,原力计划

安装成功后,编写program.cs 代码,完整代码如下:

这里我们使用url的方式进行企业资质证书的识别。

using System;
using System.Threading.Tasks;
using TencentCloud.Common;
using TencentCloud.Common.Profile;
using TencentCloud.Ocr.V20181119;
using TencentCloud.Ocr.V20181119.Models;
namespace EnterpriseRecognition
{
    class Program
    {
        static void Main(string[] args)
        {
            try
            {
                // 实例化一个认证对象,入参需要传入腾讯云账户 SecretId 和 SecretKey,此处还需注意密钥对的保密
                // 代码泄露可能会导致 SecretId 和 SecretKey 泄露,并威胁账号下所有资源的安全性。以下代码示例仅供参考,建议采用更安全的方式来使用密钥,请参见:https://cloud.tencent.com/document/product/1278/85305
                // 密钥可前往官网控制台 https://console.cloud.tencent.com/cam/capi 进行获取
                Credential cred = new Credential
                {
                    SecretId = "你的SecretId",
                    SecretKey = "你的SecretKey"
                };
                // 实例化一个client选项,可选的,没有特殊需求可以跳过
                ClientProfile clientProfile = new ClientProfile();
                // 实例化一个http选项,可选的,没有特殊需求可以跳过
                HttpProfile httpProfile = new HttpProfile();
                httpProfile.Endpoint = ("ocr.tencentcloudapi.com");
                clientProfile.HttpProfile = httpProfile;

                // 实例化要请求产品的client对象,clientProfile是可选的
                OcrClient client = new OcrClient(cred, "ap-beijing", clientProfile);
                // 实例化一个请求对象,每个接口都会对应一个request对象
                BizLicenseOCRRequest req = new BizLicenseOCRRequest();
                req.ImageUrl = "https://p8.itc.cn/q_70/images03/20201121/bfa9d2cace6740fb9ace776250d6cd0a.jpeg";

                // 返回的resp是一个BizLicenseOCRResponse的实例,与请求对象对应
                BizLicenseOCRResponse resp = client.BizLicenseOCRSync(req);
                // 输出json格式的字符串回包
                Console.WriteLine(AbstractModel.ToJsonString(resp));
            }
            catch (Exception e)
            {
                Console.WriteLine(e.ToString());
            }
            Console.Read();
        }
    }
}

解决方案如下图:

C#实战:基于腾讯OCR技术实现企业证书识别和数据提取实践,评测,Net,c#,ocr,人工智能,腾讯云,原力计划

找一个营业执照的图片,我们可以通过网络搜索 获取图片地址:

C#实战:基于腾讯OCR技术实现企业证书识别和数据提取实践,评测,Net,c#,ocr,人工智能,腾讯云,原力计划

运行代码如下图:

C#实战:基于腾讯OCR技术实现企业证书识别和数据提取实践,评测,Net,c#,ocr,人工智能,腾讯云,原力计划

格式化效果如下:

{
    "RegNum":"",
    "Name":"大连长山渔港水产有限公司",
    "Capital":"",
    "Person":"王黎明",
    "Address":"辽宁省大连市长海县小长山岛镇房 身村盐场屯",
    "Business":"许可项目:食品生产,食品经营(依法须经批准的项目,经相关部门批准后方可开展经营活动,具体经营项目以审 批结果为准)一般项目;水产品批发,水产品收购,水产品零售(除依法须经批准的项目外,凭营业执照依法自主开展经营活动)",
    "Type":"有 限责任公司(法人独资)",
    "Period":"2020年11月20日至长期",
    "ComposingForm":"",
    "SetDate":"2020年11月20日",
    "RecognizeWarnCode":[

    ],
    "RecognizeWarnMsg":[

    ],
    "IsDuplication":-1,
    "RegistrationDate":"",
    "RequestId":"3b68eaff-5c51-4f3a-b592-34d7b14bc45b"
}

基于拿到的接送数据,我们就可以进行相应业务的处理了。这里只做功能演示,功能只做到这一步。

六、总结

腾讯云文字识别服务是一种高性能、高准确率的文字识别服务,可广泛应用于各种文字识别场景,如图像OCR、身份证识别、银行卡识别等。它提供简单易用的API接口,方便开发者快速集成和使用。有文字识别需要的朋友推荐使用!

腾讯云OCR技术助力企业证书识别和数据提取实践文章来源地址https://www.toymoban.com/news/detail-686203.html

到了这里,关于C#实战:基于腾讯OCR技术实现企业证书识别和数据提取实践的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 腾讯云OCR识别

    目录 前言 一、腾讯云身份验证 二、使用API 2.1 Python OCR  API调用 2.2 JAVA OCR  API调用 2.3 Go OCR  API调用          2.4 Nodejs OCR  API调用 2.5 .Net  API调用 2.6 C++  API调用 三、代码仓库源码 提示:这里可以添加本文要记录的大概内容:   为了帮助同学们进行OCR识别,本文一共

    2024年02月06日
    浏览(47)
  • 【智慧交通项目实战】 《 OCR车牌检测与识别》(二):基于YOLO的车牌检测

    👨‍💻 作者简介: CSDN、阿里云人工智能领域博客专家,新星计划计算机视觉导师,百度飞桨PPDE,专注大数据与AI知识分享。✨ 公众号:GoAI的学习小屋 ,免费分享书籍、简历、导图等,更有交流群分享宝藏资料,关注公众号回复“加群”或➡️ 点击链接 加群。 🎉 专栏推

    2024年02月08日
    浏览(63)
  • 腾讯云健康码+行程码OCR文字识别

    公司内部为了监控员工健康码状态,要求系统自动识别员工上传的 健康码 和 行程码 ,并且将情况通知到对应的人员进行后续跟踪。做了如下研究,后续会用到公司系统中(公司内部也基于python3.9、opencv4.5研发了自动识别系统),这边文章基于腾讯云的OCR文字识别。  前面的

    2024年02月16日
    浏览(33)
  • 从0-1,使用腾讯OCR进行身份证识别

    目录 1.申请腾讯OCR权限 2.代码思路 3.Postman测试​  获取 secretId 和 secretKey,见上文 从0到1,申请cos服务器并上传图片到cos文件服务器-CSDN博客 https://blog.csdn.net/m0_55627541/article/details/133902798 入参有两个值,第一个为图片的云服务器路径,第二个为版面(正面/反面) controller servic

    2024年02月07日
    浏览(47)
  • Java集成腾讯云OCR身份证识别接口

            项目用到身份证识别获取人员信息的功能,于是想到了腾讯云提供这样的API。在整合代码过程都很顺利,利用腾讯云官方SDK很快集成进来。但是在上测试环境部署时有了新的问题,通过Nginx代理后的环境无法访问到目标腾讯云接口,遂有了如下的改造过程。        

    2024年02月08日
    浏览(45)
  • C# PaddleInference OCR 验证码识别

    目录 说明 效果 项目 测试图片 代码 下载  C# PaddleInference OCR 验证码识别 自己训练的模型,只针对测试图片类型,准确率99%    VS2022+.net4.8+OpenCvSharp4+Sdcb.PaddleInference using OpenCvSharp; using Sdcb.PaddleInference.Native; using Sdcb.PaddleInference; using System; using System.Collections.Generic; using System.

    2024年02月16日
    浏览(33)
  • [C#]调用tesseact-ocr的traineddata模型进行ocr文字识别

    【框架地址】 https://github.com/charlesw/tesseract 【算法介绍】 Tesseract OCR是一个开源的光学字符识别引擎,它可以将图像中的文字转换成可编辑和可搜索的文本格式。Tesseract由惠普实验室于1985年开始开发,并在2005年被Google收购后成为了开源项目。自那时起,它一直在不断的更新和

    2024年02月02日
    浏览(42)
  • OCR文字识别技术

    OCR全称是optical character recognition,中文光学字符识别。 主要技术是:把图像形状转变为文本字符。 简单来说,OCR技术就是通过图像处理和模式识别技术对光学的字符进行识别,即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。 OCR 支持各

    2024年02月08日
    浏览(41)
  • 【智慧交通项目实战】《 OCR车牌检测与识别》(一)

    👨‍💻 作者简介: CSDN、阿里云人工智能领域博客专家,新星计划计算机视觉导师,百度飞桨PPDE,专注大数据与AI知识分享。✨ 公众号:GoAI的学习小屋 ,免费分享书籍、简历、导图等,更有交流群分享宝藏资料,关注公众号回复“加群”或➡️ 点击链接 加群。 🎉 专栏推

    2024年02月07日
    浏览(49)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包