Xilinx QDMA说明和测试

这篇具有很好参考价值的文章主要介绍了Xilinx QDMA说明和测试。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1 测试工程

使用QDMA的Example工程,该工程可从Github下载,使用的FPGA板卡为浪潮的F37X加速器,运行工程目录下的run.sh执行run.tcl即可完成工程的创建和编译。
xilinx qdma,# XIlinx DMA说明和测试,fpga开发

2 驱动安装

本节主要介绍QDMA驱动的源文件、编译和安装过程。

2.1 源文件说明

1.下载地址:DMA驱动下载
2.文件说明

文件 说明
apps 应用文件
docs 说明文件
driver 驱动源文件
scripts 脚本文件
RELEASE 版本说明
Makefile.txt Makefile
bsd_license.txt 证书
COPYING 权限
license.txt 证书

2.2 驱动编译安装

1.依赖库安装:QDMA驱动依赖于libaio,所以在编译驱动前需要安装该库。

sudo apt-get install libaio-dev

2.驱动编译
2.1 执行make clean && make命令完成驱动文件的编译,在文件夹会生成bin文件夹,里面包含下述文件。如果需要添加新设备,可以在driver/src/pci_ids.h文件中添加。

文件 说明
dma-ctl QDMA的控制和配置应用程序
dma-to-device 执行MM或ST模式的host-to-card的传输事务
dma-from-device 执行MM或ST模式的card-to-host的传输事务
dma-perf 测量QDMA的性能
qdma-pf.ko PF驱动
qdma-vf.ko VF驱动
dma-latency 测量ST H2C/C2H传输的乒乓延时
dma-xfer 说明QDMA传输的简单应用

2.2 如果只需要PF驱动可以执行make driver MODULE=mod_pf
2.3 如果只需要VF驱动可以执行make driver MODULE=mod_vf
2.4 如果要启用CPM5的VF 4K队列,执行make EQDMA_CPM5_VF_GT_256Q_SUPPORTED=1

3.驱动安装
3.1 执行sudo make install安装驱动和应用程序,执行完该命令后在/user/local/sbin文件下生成dma-ctl、dma-to-device等应用程序,在/lib/modules/<kernel version>/qdma文件夹下生成qdam-pf.ko和qdma-vf.ko驱动程序。
3.2 如果只安装驱动程序,可以执行sudo make install-mods
3.3 如果只安装应用程序,可以执行sudo make install-apps
3.4 如果需要卸载驱动和应用程序,可以执行sudo make uninstall

4.驱动加载
4.1 下载FPGA程序,执行lspci -vd <vendor id>找到设备的BDF号。
4.2 在加载驱动前需要生成一个qdma.conf文件放到/etc/modprobe.d文件夹下,用于参数传递。在scripts文件夹下有一个qdma_generate_conf_file.sh脚本,辅助生成配置文件。执行下述命令,脚本会自动在/etc/modprobe.d文件夹下生成qdma.conf文件。

sudo ./qdma_generate_conf_file.sh <bus_num> <num_pfs> <mod> <config_bar> <master_pf>
参数 说明
bus_num BDF中的B
num_pfs PF支持的数量,默认为4
mod 驱动的模式,默认为0
0-Auto;1-Poll;2-Direct Interrupt
3-Indirect Interrupt; 4-Legacy Interrupt
config_bar 配置的BAR空间
master_pf 主PF

4.3 执行sudo modprobe qdma-pf加载PF驱动,执行sudo modprobe qdma-vf加载VF驱动。由于在/lib/modules/<kernel version>/qdma文件夹下有qdam-pf.ko和qdma-vf.ko驱动程序,所以系统在启动时会自动加载这两个驱动。如果不需要开机加载这两个驱动,可以在/etc/modprobe.d/blacklist.cof文件中添加blacklist qdma-pfblacklist qdma-vf语句。
5.修改qmax
执行下述命令修改最大队列数,安装驱动后默认的qmax是0,在执行测试脚本时出现错误,提示“unable to open device /dev/qdma82000-MM-0”。重启系统后这个值会恢复为0。

cat /sys/bus/pci/devices/0000:01:00.0/qdma/qmax   // 显示qmax
echo 8 > /sys/bus/pci/devices/0000:01:00.0/qdma/qmax   // 设置qmax为8

6.设置VF数量

cat /sys/bus/pci/devices/0000:01:00.0/sriov_totalvfs   // 显示每个PF的VF数量
echo 3 > /sys/bus/pci/devices/0000:01:00.0/sriov_numvfs   // 设置每个PF的VF数量为1024

3 调试工具

3.1 设备管理

应用dma-ctl用于管理驱动,可以实现下述功能,通过命令dma-ctl -h可查看帮助文件。

  • 列出设备信息
dma-ctl dev list        // 列出系统可使用的PF和VF,以及每个function的queue base和queue max
dma-ctl qdma<bdf> cap   // 列出硬件和软件的版本信息
dma-ctl qdma<bdf> stat  // 列出数据统计信息
  • 添加一个或多个队列
dma-ctl qdma<bdf> q add idx <N> [mode <st|mm>] [dir <h2c|c2h|bi|cmpt>]   // N-队列编号
dma-ctl qdma<bdf> q  add list <start_idx> <num_Qs> [mode <st|mm>] [dir <h2c|c2h|bi|cmpt>]
  • 开始一个或多个队列
dma-ctl qdma<bdf> q start idx <N> [dir <h2c|c2h|bi|cmpt>]
dma-ctl qdma<bdf> q start list <start_idx> <num_Qs> [dir <h2c|c2h|bi|cmpt>]
  • 暂停一个或多个队列
dma-ctl qdma<bdf> q stop idx <N> [dir <h2c|c2h|bi|cmpt>]
dma-ctl qdma<bdf> q stop list <start_idx> <num_Qs> [dir <h2c|c2h|bi|cmpt>]
  • 删除一个或多个队列
dma-ctl qdma<bdf> q del idx <N> [dir <h2c|c2h|bi|cmpt>]
dma-ctl qdma<bdf> q del list <start_idx> <num_Qs> [dir <h2c|c2h|bi|cmpt>]
  • 输出一个或多个队列信息
dma-ctl qdma<bdf> q dump idx <N> [dir <h2c|c2h|bi|cmpt>]
dma-ctl qdma<bdf> q dump list <start_idx> <num_Qs> [dir <h2c|c2h|bi|cmpt>]
  • 输出一个或多个队列描述符信息
dma-ctl qdma<bdf> q dump idx <N> [dir <h2c|c2h|bi|cmpt>] [desc <x> <y>]   // <x>-range start;<y>-range end
dma-ctl qdma<bdf> q dump list <start_idx> <num_Qs> [dir <h2c|c2h|bi|cmpt>] [desc <x> <y>] 
  • 输出一个或多个队列完成信息
dma-ctl qdma<bdf> q dump idx <N> [dir <h2c|c2h|bi|cmpt>] [cmpt <x> <y>]
dma-ctl qdma<bdf> q dump list <start_idx> <num_Qs> [dir <h2c|c2h|bi|cmpt>] [cmpt <x> <y>] 

输出中断信息

dma-ctl qdma<bdf> intring dump vector <N> <start_idx> <end_idx>

3.2 数据读写

  • 读寄存器
dmactl qdma<bdf> reg read bar <N> <addr>   // N-Bar号;addr-地址
  • 写寄存器
dmactl qdma<bdf> reg write bar <N> <addr>
  • 输出队列寄存器
dmactl qdma<bdf> reg dump [dmap <Q> <N>]   // Q-队列号;N-队列数量
  • 写入数据
dma-to-device [OPTIONS]
-d (--device) device path from /dev. Device name is formed as qdmabbddf-<mode>-<queue_number>
-a (--address) the start address on the AXI bus
-s (--size) size of a single transfer in bytes, default 32 bytes
-o (--offset) page offset of transfer
-c (--count) number of transfers, default 1
-f (--data input file) filename to read the data from.
-w (--data output file) filename to write the data of the transfers
-h (--help) print usage help and exit
-v (--verbose) verbose outpu
  • 读出数据
dma-from-device [OPTIONS]
-d (--device) device path from /dev. Device name is formed as qdmabbddf-<mode>-<queue_number>
-a (--address) the start address on the AXI bus
-s (--size) size of a single transfer in bytes, default 32 bytes.
-o (--offset) page offset of transfer
-c (--count) number of transfers, default is 1.
-f (--file) file to write the data of the transfers
-h (--help) print usage help and exit
-v (--verbose) verbose output

4 测试分析

4.1 测试脚本

执行脚本qdma_run_test_pf.sh完成对PF的测试,执行命令如下,整个测试流程包括获取设备、设置复位、h2c和c2h的mm接口测试、h2c的st接口测试和c2h的st接口测试。

sudo ./qdma_run_test_pf.sh <bdf> <qid_start> <num_qs> <desc_bypass_en> <pfetch_en> <pfetch_bypass_en> <flr_on>
参数 说明
bdf 设备的BDF号
qid_start 队列的起始ID
num_qs 从qid_start开始的队列数量,默认为04
desc_bypass_en 使能描述符旁路,默认为0
pfetch_en 使能预取,默认为0
pfetch_bypass_en 使能预取旁路,默认为0
flr_on 启用function level reset,默认为0
  • 获取设备:get_dev
    执行dma-ctl dev list获取设备信息。
  • 设置复位:set_flr
    如果设置了function level reset,则对修改系统中的reset文件对PCIe设备进行复位。
  • MM测试:run_mm_h2c_c2h
    1.找到AXI Lite的bar空间:get_user_bar
    2.设置设备:dev_mm_c2h、dev_mm_h2c、out_mm
    3.开始队列传输:queue_start,执行dma-ctl q adddma-ctl q start
    4.传输数据到FPGA:dma_to_device
    5.从FPGA中取出数据:dma_from_device
    6.比较两个文件的内容是否相等,结束测试。
    7.清理队列:cleanup_queue,执行dma-ctl q stopdma-ctl q del
  • H2C测试
    1.找到AXI Lite的bar空间:get_user_bar
    2.设置设备:dev_st_h2c
    3.开始队列传输:queue_start,执行dma-ctl q adddma-ctl q start
    4.传输数据到FPGA:dma_to_device
    5.读取FPGA的数据对比结果dma-ctl reg read,结束测试。
    6.清理队列:cleanup_queue,执行dma-ctl q adddma-ctl q start
  • C2H测试
    1.找到AXI Lite的bar空间:get_user_bar
    2.设置设备:dev_st_c2h、out_st
    3.开始队列传输:queue_start,执行dma-ctl q adddma-ctl q start
    4.传输数据到FPGA:dma_from_device
    5.比较两个文件的内容是否相等,结束测试。
    6.清理队列:cleanup_queue,执行dma-ctl q adddma-ctl q start

4.2 测试结果

  • 查看PCIe设备
    xilinx qdma,# XIlinx DMA说明和测试,fpga开发
  • 查看驱动加载情况
    xilinx qdma,# XIlinx DMA说明和测试,fpga开发
  • 查看驱动绑定的设备信息, 如果qmax为0,则需要设置非零的qmax,否则无法找到设备。
    xilinx qdma,# XIlinx DMA说明和测试,fpga开发
  • 测试结果
    xilinx qdma,# XIlinx DMA说明和测试,fpga开发
test_mm)
    dma-ctl qdma82000 q add idx 0 mode mm dir bi
    dma-ctl qdma82000 q start idx 0 dir bi
    dma-to-device -d /dev/qdma82000-MM-0 -f datafile_16bit_pattern.bin -s 1024
    dma-from-device -d /dev/qdma82000-MM-0 -f /tmp/out_mm82000_0 -s 1024
    cmp /tmp/out_mm82000_0 datafile_16bit_pattern.bin -n 1024
    dma-ctl qdma82000 q stop idx 0 dir bi
    dma-ctl qdma82000 q del idx 0 dir bi
  ;;

xilinx qdma,# XIlinx DMA说明和测试,fpga开发
xilinx qdma,# XIlinx DMA说明和测试,fpga开发
xilinx qdma,# XIlinx DMA说明和测试,fpga开发

  test_st_h2c)
    dma-ctl qdma82000 q add idx 0 mode st dir bi
    dma-ctl qdma82000 q start idx 0 dir bi
    dma-ctl qdma82000 reg write bar 2 0x0C 0x1
    dma-to-device -d /dev/qdma82000-ST-0 -f datafile_16bit_pattern.bin -s 1024
    dma-ctl qdma82000 reg read bar 2 0x10
    dma-ctl qdma82000 q stop idx 0 dir bi
    dma-ctl qdma82000 q del idx 0 dir bi
  ;;

xilinx qdma,# XIlinx DMA说明和测试,fpga开发
xilinx qdma,# XIlinx DMA说明和测试,fpga开发
xilinx qdma,# XIlinx DMA说明和测试,fpga开发
xilinx qdma,# XIlinx DMA说明和测试,fpga开发

  test_st_c2h)
    dma-ctl qdma82000 reg write bar 2 0x0 0x0
    dma-ctl qdma82000 q add idx 0 mode st dir bi
    dma-ctl qdma82000 q start idx 0 dir bi
    dma-ctl qdma82000 reg write bar 2 0x4 1024
    dma-ctl qdma82000 reg write bar 2 0x08 2
    dma-from-device -d /dev/qdma82000-ST-0 -f /tmp/out_st82000_0 -s 1024
    cmp /tmp/out_st82000_0 datafile_16bit_pattern.bin -n 1024
    dma-ctl qdma82000 reg write bar 2 0x08 0x22
    dma-ctl qdma82000 q stop idx 0 dir bi
    dma-ctl qdma82000 q del idx 0 dir bi
  ;;

xilinx qdma,# XIlinx DMA说明和测试,fpga开发
xilinx qdma,# XIlinx DMA说明和测试,fpga开发文章来源地址https://www.toymoban.com/news/detail-631911.html

到了这里,关于Xilinx QDMA说明和测试的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Xilinx FPGA开发环境vivado使用流程

    第一步:点击Add Sources按钮 第二步:选择add or create design sources按钮,即添加设计文件 第三步:选择create file 文件新建完成后: 此时可以定义I/O端口,我们选择自己在程序中编写。 第四步:在编辑器中编写verilog程序 XDC文件里主要是完成管脚的约束,时钟的约束,以及组的约

    2024年02月03日
    浏览(58)
  • Vivado | FPGA开发工具(Xilinx系列芯片)

    官网下载地址 最详细的Vivado安装教程 Vivado的安装以及使用_入门

    2024年02月12日
    浏览(59)
  • XILINX Ultrascale+ FPGA学习——Xillybus demo bundle 测试

    FPGA除了使用XIlinx公司自带的XDMA用于Pcie通信外,还有Xillybus这种3方的IP用于Pcie通信。XDMA无法做到比较灵活的兼容,安装驱动需要Windows进入测试模式,所以准备使用Xillybus来进行Pcie通信。 该IP的详细介绍请查看官网, 这里主要介绍一下如何使用该软件的demo bundle进行一些基本的

    2024年02月15日
    浏览(33)
  • 【FPGA】xilinx的开发软件vitis使用简介

           Xilinx的开发软件Vitis是一款全新的开发工具套件,它支持多种编程语言如C++、OpenCL、Python等,以及多种硬件平台,包括Xilinx的FPGA和ACAP(Adaptive Compute Acceleration Platform)。这使得它具有极高的灵活性,可以应对不同类型的开发需求,包括数据中心、云端和边缘智能应用

    2024年02月04日
    浏览(47)
  • Xilinx Alveo系列FPGA加速卡软件开发入门

    随着异构计算越来越火,FPGA加速卡在诸多领域的应用也越来越多。 FPGA加速卡与GPU加速卡加速原理完全不同。 GPU本质上是依靠海量的并行运算单元,提升整体的吞吐量,来吃尽内存带宽。 FPGA是通用的门阵列,按照数据结构和运算特点搭建专用运算单元,能够以更低功耗和时

    2024年02月05日
    浏览(45)
  • FPGA嵌入式开发一些Xilinx SDK库函数的理解

    最近在测试AXI Quad SPI这个IP核的端口时序,搭建BD后导出到硬件,在SDK中导入xspi_intr_example.c的源文件,在师兄的帮助下,浅浅研究了一下代码。 首先,需要修改源程序中的错误,参照CSDN文章:ZYNQ中断示例修改 做出以下修改: 此外,还要对中断驱动实例名称进行修改: 以下

    2024年02月12日
    浏览(49)
  • FPGA_ZYNQ (PS端)开发流程(Xilinx软件工具介绍)

            针对不同的应用领域,Xilinx 公司设计开发了各种逻辑资源规模和集成各 种外设功能的Zynq SOC器件,包括专为成本优化的Zynq-7000平台,面向高性 能实时计算应用领域的 Zynq UltraScale+ MPSoC,面向射频通信的 ZynqUltraScale+ RFSoC,以及具备高度可扩展特性的自适应加速平台

    2024年01月16日
    浏览(64)
  • [FPGA开发]解决正点原子Xilinx下载器无法下载、灯不亮的问题

    使用正点原子的Xilinx下载器下载时,电脑无法识别下载器,Vivado无法识别开发版。 1.检查XIlinx下载器的灯是否亮起。 亮灯 说明 解决方法 红灯亮起 下载器可以连接到PC 检查开发版是否供电正常 蓝灯亮起 下载器可以连接到PC,下载器可以连接到开发版 正常状态 灯不亮 下载器

    2024年02月13日
    浏览(46)
  • Xilinx FPGA SPIx4 配置速度50M约束语句(Vivado开发环境)

    qspi_50m.xdc文件: 等同于图形化配置方式:

    2024年02月22日
    浏览(61)
  • Xilinx FPGA DDR3设计(三)DDR3 IP核详解及读写测试

    引言 :本文我们介绍下Xilinx DDR3 IP核的重要架构、IP核信号管脚定义、读写操作时序、IP核详细配置以及简单的读写测试。 7系列FPGA DDR接口解决方案如图1所示。 图1、7系列FPGA DDR3解决方案 1.1 用户FPGA逻辑(User FPGA Logic) 如图1中①所示,用户FPGA逻辑块是任何需要连接到外部

    2024年02月06日
    浏览(52)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包