【百度智能云】教程:连接百度ai开放平台api接口并完成语音识别的任务

这篇具有很好参考价值的文章主要介绍了【百度智能云】教程:连接百度ai开放平台api接口并完成语音识别的任务。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

前言与介绍

本文章介绍了如何在Pycharm上用python语言简单的对连接百度ai开放平台的语音识别功能api端口的调用,并在代码里实现了现录音识别内容。

平台与相关工具

windows10、Pycharm、Python3.9
百度智能云官网为:百度ai开放平台官网

操作流程

  1. 注册百度智能云账号并打开控制台
    【百度智能云】教程:连接百度ai开放平台api接口并完成语音识别的任务
    百度ai平台有许多现有的功能端口可以使用

  2. 创建自己的应用并按需求开通端口
    【百度智能云】教程:连接百度ai开放平台api接口并完成语音识别的任务
    比如我这里开启了短语音识别的四种语言端口
    【百度智能云】教程:连接百度ai开放平台api接口并完成语音识别的任务

  3. 创建应用后在应用中心可以查询应用的API KEY与Secret Key(这两个最重要且在后续需要用到)
    【百度智能云】教程:连接百度ai开放平台api接口并完成语音识别的任务

  4. 为自己的账户充一点点钱(一两块就行),每次调用端口会有一点点的消费

  5. 通过代码调用端口

# encoding:utf-8
import wave
import requests
import time
import base64
from pyaudio import PyAudio, paInt16

import webbrowser

framerate = 16000 # 采样率
num_samples = 2000 # 采样点
channels = 1 # 声道
sampwidth = 2 # 采样宽度 2bytes
FILEPATH = 'speech.wav' # 设置语音文件保存位置
base_url = "https://openapi.baidu.com/oauth/2.0/token?grant_type=client_credentials&client_id=%s&client_secret=%s"
APIKey = "这里填入自己的"
SecretKey = "这里填入自己的"
HOST = base_url % (APIKey, SecretKey)


def getToken(host):
    res = requests.post(host) #获取 access_token
    return res.json()['access_token']

def save_wave_file(filepath, data):
    wf = wave.open(filepath, 'wb')
    wf.setnchannels(channels)
    wf.setsampwidth(sampwidth)
    wf.setframerate(framerate)
    wf.writeframes(b''.join(data))
    wf.close()

def my_record():
    pa = PyAudio()
    stream = pa.open(format=paInt16, channels=channels,rate=framerate, input=True, frames_per_buffer=num_samples)
    my_buf = []
    # count = 0
    t = time.time()
    print('正在录音...')
    while time.time() < t + 5: # 秒
        string_audio_data = stream.read(num_samples)
        my_buf.append(string_audio_data)
    print('录音结束.')
    save_wave_file(FILEPATH, my_buf)
    stream.close()


def get_audio(file):
    with open(file, 'rb') as f:
        data = f.read()
    return data


def speech2text(speech_data, token, dev_pid=1537):
    FORMAT = 'wav'
    RATE = '16000'
    CHANNEL = 1
    CUID = 'ag2s'
    SPEECH = base64.b64encode(speech_data).decode('utf‐8')
    data = {
        'format': FORMAT,
        'rate': RATE,
        'channel': CHANNEL,
        'cuid': CUID,
        'len': len(speech_data),
        'speech': SPEECH,
        'token': token,
        'dev_pid': dev_pid
    }

    url = "https://vop.baidu.com/server_api"
    headers = {
        'Content-Type': 'application/json',
        'Accept': 'application/json'
    }

    # r=requests.post(url,data=json.dumps(data),headers=headers)
    print('正在识别...')
    r = requests.post(url, json=data, headers=headers)
    Result = r.json()
    if 'result' in Result:
        return Result['result'][0]
    else:
        return Result

if __name__ == '__main__':
    flag = 'y'
    while flag.lower() == 'y':
        print('请输入数字选择语言:')
        devpid = input('1536:普通话(简单英文),1537:普通话(有标点),1737:英语,1637:粤语,1837:四川话\n')
        my_record()
        TOKEN = getToken(HOST)
        speech = get_audio(FILEPATH)
        result = speech2text(speech, TOKEN, int(devpid))
        print(result)
        flag = input('Continue?(y/n):')

代码运行后结果如下:【百度智能云】教程:连接百度ai开放平台api接口并完成语音识别的任务


dev_pid表格如下:
【百度智能云】教程:连接百度ai开放平台api接口并完成语音识别的任务


注意:百度短语音识别之接受60秒以下的音频识别成文字,并有音频格式和编码的要求,如果输入的音频不符合要求需要进行转换(具体方法请查看官方提供的api文档)官方音频转换方式
【百度智能云】教程:连接百度ai开放平台api接口并完成语音识别的任务文章来源地址https://www.toymoban.com/news/detail-508591.html

到了这里,关于【百度智能云】教程:连接百度ai开放平台api接口并完成语音识别的任务的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 拼多多开放平台的API接口可以获取拼多多电商数据。以下是API接口流程

     使用拼多多开放平台的API接口可以获取拼多多电商数据。以下是一般的API接口流程: 1. 注册开发者账号:首先,您需要在拼多多开放平台注册一个开发者账号。通过开发者账号,您可以获得API密钥和其他必要的信息。 2. 鉴权与认证:在使用API之前,您需要获取访问令牌(

    2024年02月11日
    浏览(26)
  • 萤石开放平台——怎么通过API接口远程添加摄像头?

    高科技摄像头特别是海康萤石摄像头,已经不再只局限于简单的视频功能,特别是智能AI的普及,摄像头也华丽变身成了一个个独立的智能个体,可以实现人脸抓拍,人形检测,客流统计等店铺值守场景,也可以实现安全帽识别,车辆识别,非法入侵识别等智慧工地场景。但

    2023年04月08日
    浏览(27)
  • ChatGPT“保姆级教程”——手把手教你5分钟快速AI智能文字转爆款视频(剪映+百度AIGC平台)

    在这个数字时代,视频已经成为了最流行的内容形式之一。而如何自动将文字转化为引人注目的视频内容呢?本教程将为你提供两个不同的方法:一个是利用ChatGPT和剪映,另一个是利用ChatGPT和百度AIGC平台。无论你是一名内容创作者、社交媒体经营者还是企业营销人员,都会

    2024年02月09日
    浏览(72)
  • Uniapp+基于百度智能云完成AI视觉功能(附前端思路)

    本博客使用uniapp+百度智能云图像大模型中的AI视觉API(本文以物体检测为例)完成了一个简单的图像识别页面,调用百度智能云API可以实现快速训练模型并且部署的效果。 从相册选择图片后上传后,点击识别,即可进行虫害识别。 首先,你可能需要有一个百度智能云的账号

    2024年04月23日
    浏览(12)
  • 百度智能云分布式数据库 GaiaDB-X 与龙芯平台完成兼容认证

    近日,百度智能云的分布式关系型数据库软件 V3.0 与龙芯中科技术股份有限公司的龙芯 3C5000L/3C5000 处理器平台完成兼容性测试,功能与稳定性良好,获得了龙架构兼容互认证证书。 通用 CPU 处理器是信息产业的基础部件,是关系到国家命运的战略产业之一。国产 CPU 目前主要

    2024年02月19日
    浏览(24)
  • 脸鉴AI开放平台:轻松上手的人工智能算法

    序言 一、提升开发效率工具 1.1封装view窗口 1.2封装常用功能接口 1.3提供基础接口代码块 二、使用介绍 2.1 注册登录 2.2 新建应用 2.3 下载应用 2.4 安装包介绍 2.5 demo项目 2.6 配置demo 2.7 运行demo 三、使用结果 3.1 摄像头采集人脸添加模板 3.2 实时画面1:N人脸检测 3.3 照片测

    2024年02月08日
    浏览(31)
  • 百度智能创做AI平台

    家人们好,在数字化时代,人工智能正引领着一场前所未有的创新浪潮。今天,我们将为大家介绍百度智能创做AI平台,这个为创意赋能、助力创作者的强大工具。无论你是创意工作者、内容创作者,还是想要释放内心创造力的个人,百度智能创做AI平台都将成为你的得力助手

    2024年02月13日
    浏览(26)
  • ChatGPT工作提效之使用python开发对接百度地图开放平台API的实战方案(批量路线规划、批量获取POI、突破数量有限制、批量地理编码)

    ChatGPT工作提效之初探路径独孤九剑遇强则强 ChatGPT工作提效之在程序开发中的巧劲和指令(创建MySQL语句、PHP语句、Javascript用法、python的交互) ChatGPT工作提效之生成开发需求和报价单并转为Excel格式 ChatGPT工作提效之小鹅通二次开发批量API对接解决方案(学习记录同步、用户注

    2024年02月06日
    浏览(34)
  • 百度智能AI接口:植物智能识别系统设计与实现

     博主介绍 :黄菊华老师《Vue.js入门与商城开发实战》《微信小程序商城开发》图书作者,CSDN博客专家,在线教育专家,CSDN钻石讲师;专注大学生毕业设计教育和辅导。 所有项目都配有从入门到精通的基础知识视频课程,免费 项目配有对应开发文档、开题报告、任务书、

    2024年02月04日
    浏览(27)
  • 百度智能AI接口:动物智能识别系统设计与实现

     博主介绍 :黄菊华老师《Vue.js入门与商城开发实战》《微信小程序商城开发》图书作者,CSDN博客专家,在线教育专家,CSDN钻石讲师;专注大学生毕业设计教育和辅导。 所有项目都配有从入门到精通的基础知识视频课程,免费 项目配有对应开发文档、开题报告、任务书、

    2024年02月05日
    浏览(42)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包