【海思SS528】MPP媒体处理软件V5.0 | 音频模块 - 学习笔记

这篇具有很好参考价值的文章主要介绍了【海思SS528】MPP媒体处理软件V5.0 | 音频模块 - 学习笔记。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。


mpp 编解码,嵌入式开发,媒体,音视频,学习

🎄一、概述

MPP是Media Process Platform的缩写,即媒体处理平台。MPP媒体处理软件V5.0,是媒体处理平台开发手册的第五版。
本篇文章主要记录学习音频模块的笔记,很多内容在开发手册里都有的,这里只记录自己认为重要的一些内容,供后续学习、记忆。

音频(AUDIO)模块包括四个子模块:

  • 音频输入、
  • 音频输出、
  • 音频编码、
  • 音频解码

音频输入和输出模块通过对芯片音频接口的控制实现音频输入输出功能。
音频编码和解码模块提供对G711、 G726、 ADPCM格式的音频编解码功能,并支持录制和播放LPCM格式的
原始音频文件

mpp 编解码,嵌入式开发,媒体,音视频,学习

🎄二、音频输入(AI) 和 音频输出(AO)

✨2.1 音频接口和 AI、 AO 设备

音频输入输出接口简称为AIO( Audio Input/Output)接口,用于和Audio Codec对接,完成声音的录制和播放。
AIO接口分为两种类型:只支持输入或只支持输出。

  • 当为输入类型时,又称为AIP;
  • 当为输出类型时,又称为AOP

AI设备:在海思媒体处理软件中,将音频输入(AI)接口抽象为 AI设备;
AO设备:在海思媒体处理软件中,负责抽象音频接口输出功能的单元;

SS528芯片内部集成 1 个 AIO, 包含 2 个 AIP(Audio Input Port)和 2 个 AOP(Audio Output
Port),也就是有2个AI设备、2个AO设备。

✨2.2 录音和播放原理

录音:采集声音,转换成数字信号并保存起来的过程,一般有如下三个过程:

  • 原始音频信号一般是模拟信号的形式的,通过Audio Codec,按一定采样率和采样精度转换为数字信号。
  • Audio Codec以I2S时序或PCM时序的方式,将数字信号传输给AI设备。
  • 芯片利用DMA将AI设备中的音频数据搬移到内存中,完成录音操作

mpp 编解码,嵌入式开发,媒体,音视频,学习

播放:将保存的数字信号的声音取出,转换成模拟信号输出的过程:

  • 芯片利用 DMA 将内存中的数据传输到 AO 设备。
  • AO设备通过 I2S 时序或 PCM 时序向 Audio Codec 发送数据。
  • Audio Codec 完成数字信号到模拟信号的转换过程,并输出模拟信号。

mpp 编解码,嵌入式开发,媒体,音视频,学习

✨2.3 AI、AO 通道

这一小节,看不太懂,先记录一些可以理解的
AIO在不同协议时,支持的AI、 AO多路复用模式有差异,不同的解决方案也不相同。
AI、 AO可以在AI/AO设备最大支持的比特范围内,按采样精度拆分AI和AO通道,并按照时序上的顺序,依次视为AiChn0、 AiChn1等或AoChn0、 AoChn1等。例如:SS528的AIO最大支持左右声道各160bit,可以拆分为16bit 20通道,也可以拆分32bit 10通道等等。

SS528V100 AIO 最大支持 AI、 AO 通道数如下图:
mpp 编解码,嵌入式开发,媒体,音视频,学习
SS528V100/SS524V100上音频AI支持的最大通道数为20通道, I2S模式下AO支持的最大通道数为8通道(每根数据线支持2通道,受I2S数据线数量限制,最大仅4通道有效), PCM模式下AO支持的最大通道数为1通道。多通道情况下, AI、 AO视通道排列中相对应的两通道为立体声输入输出。

✨2.4 重采样

重采样:将一个音频信号从一个采样率转换为另一个采样率。
音频输入和音频输出模块支持对音频数据实施重采样。

  • 如果启用AI重采样功能,则在 ss_mpi_ai_get_frame获取数据返回前,内部将会先执行重采样处理,再返回处理后的数据。
  • 如果启用了AO重采样功能,则音频数据在发送给AO之前,内部先执行重采样处理,处理完成后再发送给AO通道进行播放。

音频重采样支持任意两种不同采样率( 64k、 96k除外)之间的重采样,也支持64kHz下采样到8kHz或16kHz。

  • 重采样支持的输入采样率为: 8kHz, 11.025kHz, 12kHz,16kHz, 22.05kHz, 24kHz, 32kHz, 44.1kHz, 48kHz, 64kHz,
  • 不支持的输入采样率: 96kHz;
  • 支持的输出采样率为: 8kHz, 11.025kHz, 12kHz, 16kHz,22.05kHz, 24kHz, 32kHz, 44.1kHz, 48kHz;
  • 不支持的输出采样率: 64kHz,96kHz;
  • 重采样仅支持处理单声道

mpp 编解码,嵌入式开发,媒体,音视频,学习

🎄三、音频编码和解码

✨3.1 音频编解码流程

海思SS528的音频编码、解码都是用软件的,而非硬件。
SDK音频的编码类型G711、 G726、 ADPCM_DVI4、 ADPCM_ORG_DVI4、ADPCM_IMA均使用CPU软件编解码。
所有的解码功能都基于独立封装的音频解码库,核心解码器工作在用户态,使用CPU软件解码。
SDK支持通过SYS模块的绑定接口,将一个AI通道绑定到AENC通道,实现录音编码功能;
也可以将一个ADEC通道绑定到AO通道,实现解码播放功能。

✨3.2 音频编解码协议

下图是SS528 音频编解码协议说明:
mpp 编解码,嵌入式开发,媒体,音视频,学习
表中列出来的编码协议,仅支持对单个声道的音频帧进行编码,如果送给编码通道的是立体声音频帧,则只会对左声道数据进行编码,编码出来的码流只带左声道数据。

✨3.3 语音帧结构

使用语音编解码库进行G711、 G726、 ADPCM格式的编码,编码后的码流遵循以下表格中描述的帧结构,即在每帧码流数据的净荷数据之前填充有4个字节的帧头;使用语音编解码库进行以上格式的解码时,需要读取相应的帧头信息。

帧头中的数据净荷长度(单位:short)字段计算公式:
数据净荷长度 = (每帧采样点数 – 输入预测采样点数)/压缩率 + 输出预测帧头长度。

下图是语音帧结构:
mpp 编解码,嵌入式开发,媒体,音视频,学习

mpp 编解码,嵌入式开发,媒体,音视频,学习

🎄四、总结

本文主要记录学习海思SS528媒体开发手册《MPP媒体处理软件V5.0》的一些重点内容,供后续深入学习音视频做参考,手册的很多内容没看明白,所以只记录一些重点,方便记忆。以后有长进了再补充 *_^

mpp 编解码,嵌入式开发,媒体,音视频,学习
如果文章有帮助的话,点赞👍、收藏⭐,支持一波,谢谢 😁😁😁文章来源地址https://www.toymoban.com/news/detail-542622.html

到了这里,关于【海思SS528】MPP媒体处理软件V5.0 | 音频模块 - 学习笔记的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • RK3568-mpp(Media Process Platform)媒体处理软件平台

    概述 系统架构

    2024年02月09日
    浏览(28)
  • 海思SD3403/SS928开发(一)简介

    SD3403/SS928是一颗面向监控市场推出的专业 ultra-HD Smart IP Camera SOC。 SD3403/SS928处理器核心具有四核ARM Cortex-A55@ 1.2GHz,32KB I-Cache,32KB D-Cache,512KB L3 Cache,该芯 片最高支持四路 sensor 输入,支持最高 4K60 的 ISP 图像处理能力,支持 3F WDR、 多级降噪、六轴防抖、硬件拼接等多种图像

    2024年02月11日
    浏览(28)
  • 软考:中级软件设计师:多媒体基础,音频,图像,颜色,多媒体技术的种类,图像音频视频的容量计算,常见的多媒体标准

    提示:系列被面试官问的问题,我自己当时不会,所以下来自己复盘一下,认真学习和总结,以应对未来更多的可能性 关于互联网大厂的笔试面试,都是需要细心准备的 (1)自己的科研经历, 科研内容 ,学习的相关领域知识,要熟悉熟透了 (2)自己的实习经历,做了 什

    2024年02月09日
    浏览(40)
  • 【python】《多媒体技术与应用》实验报告「数字音频处理」

     《多媒体技术与应用》 实验报告 实验名称 数字视频处理 实验时间 2022/4/25 姓名 班级 计非201 学号 成绩 一.  实验目的 1. 掌握数字音频的读取与打开; 2. 掌握数字音频信号的频谱分析; 3. 验证 PCM 编码算法。 二.实验原理 声音是由物体振动而产生的,声波的三要素是频率

    2023年04月16日
    浏览(40)
  • 海思SD3403,SS928/926,hi3519dv500,hi3516dv500移植yolov7,yolov8(9)

     上一节yolov8的训练已经完成了,现在要开始做模型的转换了,这里和yolov7方式相似,但是有一些差异,尤其是yolov7的不带NMS部分的输出顺序和yolov8的输出顺序与格式是有差异的。    首先还是要自己手动加入rpn_op,这里包含了filter,sort,nms部分。 我们一个一个看,首先filter.p

    2024年01月17日
    浏览(41)
  • 【Nginx18】Nginx学习:WebDav文件存储与图片媒体处理模块

    今天的内容怎么说呢?有两个感觉非常有意思,另外一些就差点意思。有意思的是,咱们可以直接用 Nginx 的 Webdav 功能搭建一个网盘,另外也可以实现动态的图片处理。这两个功能吧,有其局限性,但也非常方便。另外的流媒体部分的内容,主要 FLV 和 MP4 这两种视频媒体格式

    2024年02月12日
    浏览(33)
  • 多媒体音频焦点浅析

    多个音源可以同时向同一个输出流进行播放音频,如果没有音频焦点管控,就会出现多个音源同时播放的现象,给用户带来不便;而Android为了避免多个音源同时播放,就引入了音频焦点的概念,所有音频应用都统一按照音频焦点的规定执行,就可以避免该现象发生。 当应用

    2024年02月13日
    浏览(30)
  • 每日一博 - MPP(Massively Parallel Processing,大规模并行处理)架构

    MPP(Massively Parallel Processing,大规模并行处理)架构是一种常见的数据库系统架构,主要用于提高数据处理性能。它通过将多个单机数据库节点组成一个集群,实现数据的并行处理。 在 MPP 架构中,MPP采用 非共享架构(Share Nothing) , 每个节点都拥有独立的磁盘存储和内存系

    2024年02月12日
    浏览(35)
  • 服装加工ERP软件包含哪些模块?可以帮助企业处理什么难题

    服装的生产加工管理涉及分色分码、材料选购、车间算料、成本核算、接单报价、图纸设计、产品开发、库存盘点等诸多业务环节,而如何处理数据共享和流程之间的协作问题是很多服装加工企业面对的经营难题。 想要在激烈的市场竞争当中建立差异化的竞争优势,提升管理

    2024年01月22日
    浏览(38)
  • 鸿蒙实战多媒体运用:【音频组件】

    音频组件用于实现音频相关的功能,包括音频播放,录制,音量管理和设备管理。 图 1  音频组件架构图 基本概念 采样 采样是指将连续时域上的模拟信号按照一定的时间间隔采样,获取到离散时域上离散信号的过程。 采样率 采样率为每秒从连续信号中提取并组成离散信号

    2024年03月10日
    浏览(44)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包