快速调用百度AI开放平台的API,以OCR通用文字识别为例(封装函数进行连续调用)

这篇具有很好参考价值的文章主要介绍了快速调用百度AI开放平台的API,以OCR通用文字识别为例(封装函数进行连续调用)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

百度ai接口调用,项目开发,百度,人工智能,百度云,python

🔥博客主页:是dream

🚀系列专栏:深度学习环境搭建、环境配置问题解决、自然语言处理、语音信号处理、项目开发

💘每日语录:眼里有不朽的光芒 心里有永恒的希望

🎉感谢大家点赞👍收藏⭐指正✍️

百度ai接口调用,项目开发,百度,人工智能,百度云,python

前言

        百度开放平台允许开发者访问和利用百度的各种服务和功能,包括语音识别、人脸识别、文字识别、自然语言处理等等。这些API能够满足我们绝大部分需求,来供我们学习和使用。本文就OCR文字识别为例,详细介绍新手小白如何调用百度开放平台的API。

前期准备工作

1、注册一个百度AI开放平台的账号

网址:百度AI开放平台-全球领先的人工智能服务平台 (baidu.com)

2、编译器:Pycharm

搜索 OCR文字识别,点击立即使用。

百度ai接口调用,项目开发,百度,人工智能,百度云,python

进入到OCR文字识别的界面,点击“去领取”。

        百度开放平台是可以免费试用的,一个月可以调用几千次,足够我们用来学习和使用。

百度ai接口调用,项目开发,百度,人工智能,百度云,python

        直接点击全部领取。

百度ai接口调用,项目开发,百度,人工智能,百度云,python

点击应用列表,进行创建应用(信息随便填,但也不要太离谱,SDK不要选择)

百度ai接口调用,项目开发,百度,人工智能,百度云,python

        这里特别需要注意的是,你需要保管好API Key 和Secret Key,后边会使用到。

正式调用环节(仅需两步)

获取你的access_token

        首先,我们获得access_token,具体的方法是通过百度的API文档中获得,很简单,上图!

百度ai接口调用,项目开发,百度,人工智能,百度云,python

        搜索文字识别,选择“调用方式这一栏”,可以看到,官方给出了多种语言用来获取access_token,这里我选择python。将代码复制到pycharm,并将你的API Key 和Secret Key分别替换掉host中的“【官网获取的AK】”和“【官网获取的SK】”,运行代码就可以拿到你的access_token了。

        为了方便大家,这里直接附上代码。我对代码进行了部分修改,大家可以直接替换掉client_id和client_secret即可。

# encoding:utf-8
import requests 

# 替换下面的【官网获取的AK】和【官网获取的SK】为你的实际API密钥和密钥
client_id = 'YOUR_CLIENT_ID'
client_secret = 'YOUR_CLIENT_SECRET'

# 构建获取访问令牌的URL
token_url = f'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id={client_id}&client_secret={client_secret}'

# 发送请求获取访问令牌
response = requests.get(token_url)

# 检查响应状态码
if response.status_code == 200:
    access_token = response.json()['access_token']
    print(f"Access Token: {access_token}")
else:
    print("Failed to obtain Access Token")

正式开始调用

        随机选择一个文字识别场景,这里我选择了通用文字识别(高精度版本)。

百度ai接口调用,项目开发,百度,人工智能,百度云,python

        复制里边的代码,并将自己的access_token添加上去,就可以进行文字识别了!

测试

        随机截取了一张图片,来测试一下效果如何。

百度ai接口调用,项目开发,百度,人工智能,百度云,python

        部分结果展示:

百度ai接口调用,项目开发,百度,人工智能,百度云,python

        可以看到效果还是非常好的。

经验之谈(点赞、收藏、关注、不迷路)

        需要特别注意的是,我们获得到的 access_token 具有时效性,通常在30天后会失效,因此需要定期重新获取。并且,官方给的代码,我们每次需要识别图片的时候,都需要更改图片的途径,这样非常麻烦,为了一劳永逸,这里建议将代码进行打包封装。这样在我们的项目中,如果需要识别图片中的文字,只需要调用相应的函数就行了。这里我直接贴出封装后的代码,需要进行文字识别的时候只需要调用ocr_image()函数即可。文章来源地址https://www.toymoban.com/news/detail-741907.html

# coding=utf-8

import sys
import json
import base64
import requests

# 保证兼容python2以及python3
IS_PY3 = sys.version_info.major == 3

API_KEY = '你的API Key'
SECRET_KEY = '你的Secret Key'
OCR_URL = "https://aip.baidubce.com/rest/2.0/ocr/v1/accurate_basic"
TOKEN_URL = 'https://aip.baidubce.com/oauth/2.0/token'


"""
    获取access token
"""
def fetch_token():
    params = {'grant_type': 'client_credentials', 'client_id': API_KEY, 'client_secret': SECRET_KEY}
    response = requests.post(TOKEN_URL, params=params)
    result = response.json()

    if ('access_token' in result.keys() and 'scope' in result.keys()):
        if not 'brain_all_scope' in result['scope'].split(' '):
            print ('please ensure has check the  ability')
            exit()
        return result['access_token']
    else:
        print ('please overwrite the correct API_KEY and SECRET_KEY')
        exit()


"""
    读取文件
"""
def read_file(image_path):
    with open(image_path, 'rb') as f:
        return f.read()


"""
    调用远程服务
"""
def request(url, data):
    response = requests.post(url, data=data.encode('utf-8'))
    if response.status_code == 200:
        return response.text
    else:
        print("Error response {}".format(response.status_code))


def ocr_image(image_path, access_token):
    # 调用OCR服务
    headers = {'Content-Type': 'application/x-www-form-urlencoded'}
    with open(image_path, 'rb') as f:
        image_data = f.read()
    params = {'access_token': access_token, 'image': base64.b64encode(image_data)}
    response = requests.post(OCR_URL, headers=headers, data=params)

    # 解析OCR结果
    result = ''
    result_json = response.json()
    for words_result in result_json["words_result"]:
        result += words_result["words"] + '\n'

    return result


if __name__ == '__main__':
    # 获取access token
    token = fetch_token()

    # 调用文字识别服务
    result = ocr_image(r"runs/detect/exp160/crops/plate/2.jpg", token)

    # 打印文字
    print(result)

百度ai接口调用,项目开发,百度,人工智能,百度云,python

看到这里,相信你已经能够掌握如何调用百度开放平台的API,关注我,后续会有更多的人工智能相关的保姆级教程。

到了这里,关于快速调用百度AI开放平台的API,以OCR通用文字识别为例(封装函数进行连续调用)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 简单三步,教你快速接入淘宝开放平台,调用官方API

        淘宝开放平台是为了方便开发者接入淘宝平台,进行商品、订单等信息的管理和交互而设计的。接入淘宝开放平台需要经过一系列审核和申请流程,而在API权限包审核时,一定要提供真实有效的证件和资料,并满足相应的条件,才能顺利申请通过。 对于一些时间和预算比

    2024年02月08日
    浏览(45)
  • 百度OCR api调用代码

    import requests import json import base64, urllib API_KEY = \\\'xx\\\' SECRECT_KEY = \\\'xx\\\' pic_name = \\\"img.jpg\\\" def ocr_baidu():     \\\"\\\"\\\"invoke token\\\"\\\"\\\"     url = \\\'https://aip.baidubce.com/oauth/2.0/token\\\'     body = {\\\'grant_type\\\': \\\'client_credentials\\\',             \\\'client_id\\\': API_KEY,             \\\'client_secret\\\': SECRECT_KEY             }  

    2024年02月21日
    浏览(26)
  • Delphi 百度智能云 OCR API 调用控件

    百度智能云提供了OCR识别功能,其识别种类非常丰富,包括:卡证文字识别、通用场景文字识别、交通场景文字识别、财务票据文字识别...等等。无论是移动端,还是PC端,通过调用OCR服务,可以方便的识别成需要的文字。 在百度智能云官方提供的调用文档中,并没有提供

    2024年02月12日
    浏览(26)
  • ChatGPT“保姆级教程”——手把手教你5分钟快速AI智能文字转爆款视频(剪映+百度AIGC平台)

    在这个数字时代,视频已经成为了最流行的内容形式之一。而如何自动将文字转化为引人注目的视频内容呢?本教程将为你提供两个不同的方法:一个是利用ChatGPT和剪映,另一个是利用ChatGPT和百度AIGC平台。无论你是一名内容创作者、社交媒体经营者还是企业营销人员,都会

    2024年02月09日
    浏览(72)
  • 通用文字识别 本地OCR接口 json数据 任意语言 不限次调用 exe服务工具免搭建部署启动即用

    在这里插入图片描述 样本识别效果: 使用方法: 启动本地OCR接口服务 图片文件=base64编码=转json格式=传到对应接口 本地OCR程序: 文件太大没法传,要会员,我刚删掉了一个复杂模型,能用上得再问我要把。微:huang582716403

    2024年02月11日
    浏览(45)
  • SpringBoot项目(百度AI整合)——如何在Springboot中使用文字识别OCR入门

    前言:本系列博客尝试结合官网案例,阐述百度 AI 开放平台里的组件使用方式,核心是如何在spring项目中快速上手应用。 本文介绍如何在Springboot中使用百度AI的文字识别OCR 其他相关的使用百度AI的文章列表如下: 如何在Springboot中使用语音文件识别 ffmpeg的安装和使用 1.从官

    2024年02月02日
    浏览(27)
  • 数据治理 | 还在人工识别表格呢?Python 调用百度 OCR API 又快又准

    文档类型的转换(PDF,Excel等)对广大社科学者来说一直是一个不大不小,但又令人十分头疼的问题。往期的实用技能分享中我们介绍过如何OCR识别图片中的文本,也介绍过如何使用 Python 读取(可以复制内容的)PDF 中的表格,将其转为 Excel 表。此时细心的小伙伴会发现一个

    2024年01月15日
    浏览(37)
  • AI人工智能课题:通用场景文字识别系统的设计与实现(基于百度智能云AI接口)

     博主介绍 :黄菊华老师《Vue.js入门与商城开发实战》《微信小程序商城开发》图书作者,CSDN博客专家,在线教育专家,CSDN钻石讲师;专注大学生毕业设计教育和辅导。 所有项目都配有从入门到精通的基础知识视频课程,免费 项目配有对应开发文档、开题报告、任务书、

    2024年02月05日
    浏览(54)
  • AI人工智能课题:通用卡证文字识别系统的设计与实现(基于百度智能云AI接口)

     博主介绍 :黄菊华老师《Vue.js入门与商城开发实战》《微信小程序商城开发》图书作者,CSDN博客专家,在线教育专家,CSDN钻石讲师;专注大学生毕业设计教育和辅导。 所有项目都配有从入门到精通的基础知识视频课程,免费 项目配有对应开发文档、开题报告、任务书、

    2024年02月04日
    浏览(42)
  • Python编程实现百度AI开放平台的接口对接方法,详解和实践指南

    Python编程实现百度AI开放平台的接口对接方法,详解和实践指南 引言 百度AI开放平台提供了丰富的人工智能接口,包括语音识别、图像识别、自然语言处理等功能。本文将通过Python编程,详解如何对接百度AI开放平台的接口,并提供实际代码示例。 准备工作 在开始之前,我们

    2024年02月13日
    浏览(31)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包