调用阿里API实现图片中的文字识别

这篇具有很好参考价值的文章主要介绍了调用阿里API实现图片中的文字识别。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

作者介绍

王雪玉,女,西安工程大学电子信息学院,2022级研究生
研究方向:机器视觉与人工智能
电子邮件:2239580540@qq.com

王泽宇,男,西安工程大学电子信息学院,2022级研究生,张宏伟人工智能课题组
研究方向:机器视觉与人工智能
电子邮件:2717124491@qq.com

一. 阿里云OCR算法介绍

1.1 阿里云OCR介绍

文字识别(OCR)可以将图片中的文字信息转换为可编辑文本,阿里云根据客户的业务场景和需求,将产品分为了通用文字识别、个人证照识别、发票凭证识别、教育场景识别、车辆物流识别、企业资质识别、小语种文字识别等几大类商品,可以满足各种客户的图片识别需求。

1.2 基于阿里云的OCR算法介绍

阿里云OCR是一款由阿里巴巴达摩院权威AI团队打造的全栈全场景OCR文本识别类产品。多年来, 通过持续整合前沿AI技术和行业实战经验,阿里云OCR打磨出了能够承载跨行业敏捷应用的技术架构,具备图像文字定位、文字识别和文字理解的全栈技术体系,形成了包含通用文本识别、卡证票据自动化分类及结构化识别、卡证票据混贴识别、表格文档批量结构化识别以及试题作业智能识别等全量OCR原子能力矩阵。支持公有云调用、私有化部署、终端 SDK 等云边端全业务场景服务能力。

二.调用阿里API实现网络图片中的文字识别实验过程

2.1 实验过程

进入阿里云官网(https://www.aliyun.com/)注册账号并登录
调用阿里API实现图片中的文字识别
在控制台搜索网络图片文字识别,选择目标产品
调用阿里API实现图片中的文字识别
领取免费的api,有效试用30天
调用阿里API实现图片中的文字识别
调用阿里API实现图片中的文字识别
往控制台,查看AppCode
调用阿里API实现图片中的文字识别

2.2 代码实现

# coding=UTF-8
import requests
host = 'https://imgurlocr.market.alicloudapi.com'
path = '/urlimages'
method = 'POST'
appcode = '你自己的AppCode'#开通服务后 买家中心-查看AppCode
querys = ''
bodys = {}
url = host + path
data = {'image':'http://img3.fegine.com/image/urlimage.png'}
# 或者base64
# data = {'image':'data:image/jpeg;base64,/9j/4A......'}
header = {"Authorization":'APPCODE ' + appcode}
try:
    res = requests.post(url,data,headers=header)
except :
    print("URL错误")
    exit()
httpStatusCode = res.status_code

if(httpStatusCode == 200):
    print("正常请求计费(其他均不计费)")
    print(res.text)
else:
    httpReason = res.headers['X-Ca-Error-Message']
    if(httpStatusCode == 400 and httpReason == 'Invalid Param Location'):
        print("参数错误")
    elif(httpStatusCode == 400 and httpReason == 'Invalid AppCode'):
        print("AppCode错误")
    elif(httpStatusCode == 400 and httpReason == 'Invalid Url'):
        print("请求的 Method、Path 或者环境错误")
    elif(httpStatusCode == 403 and httpReason == 'Unauthorized'):
        print("服务未被授权(或URL和Path不正确)")
    elif(httpStatusCode == 403 and httpReason == 'Quota Exhausted'):
        print("套餐包次数用完")
    elif(httpStatusCode == 403 and httpReason == 'Api Market Subscription quota exhausted'):
        print("套餐包次数用完,请续购套餐")
    elif(httpStatusCode == 500 ):
        print("API网关错误")
    else:
        print("参数名错误 或 其他错误")
        print(httpStatusCode)
        print(httpReason)

2.3 实验结果

调用阿里API实现图片中的文字识别

2.4 参考链接

1.https://help.aliyun.com/product/252763.html?spm=a2c4g.295338.0.0.18dd1defYQOBZX
2.https://blog.csdn.net/m0_37758063/article/details/123643861#:~:text=%E4%BD%BF%E7%94%A8python%E5%AF%B9%E9%98%BF%E9%87%8C%E4%BA%91%E7%9A%84,%E5%9B%BE%E7%89%87%E8%AF%86%E5%88%AB%20%E7%AE%97%E6%B3%95%E6%8E%A5%E5%8F%A3API%EF%BC%8C%E8%AF%86%E5%88%AB%E9%AA%8C%E8%AF%81%E7%A0%81%E4%B8%AD%E6%96%87%E5%AD%97%EF%BC%8C%E5%9B%BE%E5%83%8F%E6%95%B0%E6%8D%AE%E5%8F%AF%E4%BD%BF%E7%94%A8base64%E7%BC%96%E7%A0%81%E5%92%8Curl%E5%8F%82%E6%95%B0%EF%BC%88%E5%8F%AA%E8%83%BD%E5%90%8C%E6%97%B6%E4%BD%BF%E7%94%A8%E4%B8%80%E7%A7%8D%E6%A0%BC%E5%BC%8F%EF%BC%89%EF%BC%8C%E8%A6%81%E6%B1%82base64%E7%BC%96%E7%A0%81%E5%90%8E%E5%A4%A7%E5%B0%8F%E4%B8%8D%E8%B6%85%E8%BF%874M%EF%BC%8C%E5%9B%BE%E5%83%8F%E8%B6%8A%E5%B0%8F%E6%95%88%E7%8E%87%E8%B6%8A%E9%AB%98%EF%BC%8C%E6%94%AF%E6%8C%81jpg%2Fpng%2Fbmp%E6%A0%BC%E5%BC%8F%E3%80%82文章来源地址https://www.toymoban.com/news/detail-481625.html

到了这里,关于调用阿里API实现图片中的文字识别的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Python识别图片中的文字

    不知道大家有没有遇到过这样的问题,就是在某个软件或者某个网页里面有一篇文章,你非常喜欢,但是不能复制。或者像百度文档一样,只能复制一部分,这个时候我们就会选择截图保存。但是当我们想用到里面的文字时,还是要一个字一个字打出来。那么我们能不能直接

    2024年01月18日
    浏览(42)
  • 【Python 实战】---- 批量识别图片中的文字,存入excel中【使用百度的通用文字识别】

    1. 获取信息图片示例 2. 运行实例 3. 运行结果 4. 各个文件的位置 1. 需求分析 识别图片中的文字【采用百度的通用文字识别】; 文字筛选,按照分类获取对应的文本; 采用 openpyxl 实现将数据存入 excel 中。 2. 获取 access_token 获取本地缓存的

    2024年02月15日
    浏览(35)
  • 调用阿里云身份证识别服务识别本地图片,很详细,附工具类

    这是对应的依赖版本号查询地址,新版和旧版的依赖都可以在这里查 https://mvnrepository.com/artifact/com.aliyun/aliyun-java-sdk-ocr 接入步骤中的依赖我只添加了这个,json处理的依赖包项目本身就有,看自己情况,没有缺少对应的依赖就不需要添加了。 这是阿里云的示例地址 https://hel

    2024年02月01日
    浏览(28)
  • 通过Python的pytesseract库识别图片中的文字

    大家好,我是空空star,本篇给大家分享一下通过Python的pytesseract库识别图片中的文字。 本篇所用软件相关版本: macOS 11.6.5 Python 3.8.9 pytesseract 0.3.10 Pillow 9.4.0 Pytesseract是一个Python的OCR库,它可以识别图片中的文本并将其转换成文本形式。Pytesseract基于Google的Tesseract OCR引擎,具

    2024年02月03日
    浏览(30)
  • 零代码编程:用ChatGPT批量识别图片PDF中的文字

    有些PDF页面是图片格式,要怎么批量把图片中的文字识别出来?借助ChatGPT可以轻松完成这个任务。 首先要安装一些相关的软件和Python库。 安装tesseract-ocr(OCR)软件,最新版的是tesseract-ocr-w64-setup-v5.3.0.20221214.exe ,下载地址是https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-w64-se

    2024年02月15日
    浏览(46)
  • ORC工具(使用阿里云统一文字识别接口实现)

    废话不多,直接上代码。 转换的字符结果是一行。

    2024年02月12日
    浏览(30)
  • 【项目管理】Java OCR实现图片文字识别

    系统:Win10 Java:1.8.0_333 IDEA:2020.3.4 最近在看外国漫画的时候,发现有些漫画没有汉化的翻译,这哪看得懂。正想把那些日语输入到有道翻译一下,发现日文不会输。正巧之前有接触关于OCR的项目,所以便想用Java做一个小工具,实现图片的文字识别功能,于是我便开始了项目

    2024年02月02日
    浏览(27)
  • 【iOS】——基于Vision Kit框架实现图片文字识别

    根据苹果的官方文档,Vision可以执行面部检测、文本检测、条形码识别、图像注册和一般功能跟踪。Vision还允许将自定义Core ML模型用于分类或对象检测等任务。下面只是对文本识别的一个学习。 Vision的文本识别分为两种方式。 第一种是 快速路径(fast) ,它使用框架的字符

    2024年01月19日
    浏览(26)
  • 【实操】Java+百度ocr,实现图片识别文字小工具

    图片识别文字,咱用java也可以 通过 java+百度ocr ,实现一个截图或上传图片, 图片识别文字的小工具 。并通过 exe4j工具 将jar包封装成exe可执行桌面文件,方便使用及学习。 一位特别的老友即将 在2023年10月26日 年满 30周岁 ,愿 平安喜乐 公众号:【JavaDog程序狗】 关注公众号

    2024年02月08日
    浏览(34)
  • 【Java】使用Apache POI识别PPT中的图片和文字,以及对应的大小、坐标、颜色、字体等

    本文介绍如何使用Apache POI识别PPT中的图片和文字,获取图片的数据、大小、尺寸、坐标,以及获取文字的字体、大小、颜色、坐标。 官方文档:https://poi.apache.org/components/slideshow/xslf-cookbook.html 官方文档和网上的资料介绍的很少,很多元素,需要一点点尝试才能获取到。 注意

    2024年02月12日
    浏览(30)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包