基于XDMA的简易FPGA网卡实现（一）-Toy模板网

这篇具有很好参考价值的文章主要介绍了基于XDMA的简易FPGA网卡实现（一）。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

基于XDMA的简易FPGA网卡实现（一）

开发环境

FPGA开发板	XC7K325T
CPU	RK3399
开发主机	Win11 and ubuntu20.04
IDE版本	Xilinx Vitis IDE v2021.1.0 (64-bit) Vivado v2021.1 (64-bit)

基于XDMA的简易FPGA网卡实现（一）,linux驱动开发经验,FPGA,fpga开发,驱动开发

实现原理

FPGA侧

基于XDMA的简易FPGA网卡实现（一）,linux驱动开发经验,FPGA,fpga开发,驱动开发

top模块：顶层模块，其中例化了xmda和axil_rw模块
xdmaip：pcie dma，提供axi-lite接口读写fpga寄存器，提供axi-stream接口收发数据流
axil_rw模块：将xdma的axi-lite信号用于读写mac模块寄存器
clk_wiz_125m_90phase：提供90°相位125M时钟，供mac使用
gpio_dri模块：gpio控制器，用于模拟mdio时序读写phy
axis_dwidth_converterip：提供axis数据位宽转换功能，将xdma 128bit axi-stream转为8bit供fifo使用，使用了两个此模块实现双向转换
axis_data_fifo：两个fifo，缓存mac接收和需要发送的数据
eth_mac_1g_rgmii模块：源自verilog-eth开源项目，具有rgmii接口和速率自适应逻辑的三模式以太网MAC，axi-stream接口
ilaip：抓信号调试

CPU侧

编写linux标准网卡驱动，使用零拷贝方式收发数据

发送流程

在ndo_start_xmit函数中进行发送
将sk_buff的head和fragmentation dma_map_single得到物理地址，将物理地址和长度写入描述符
发送前netif_stop_queue，在发送完成中断唤醒。如果直接继续发送，则新的sk_buff会在上一次的完成中断中被free
开启dma使能，进行发送
在发送完成中断中关闭发送dma使能，dma_unmap_single sk_buff的物理地址，free sk_buff。判断发送fifo是否超出发送阈值。超出则运行wait_work工作队列，在work中等待fifo低于启动阈值后netif_wake_queue唤醒发送队列，未超出阈值则netif_wake_queue唤醒发送队列

接收流程

在网卡驱动的probe函数中进行第一次接收，在接收完成中断或tasklet中配置后续接收
收到接收完成中断后关闭接收dma使能
dma会将接收结果写回到result内存，读取result内存获取包长度
skb_put修改sk_buff的tail和len，dma_unmap_single sk_buff的物理地址，执行netif_rx提交到协议栈
接收完成后开始准备新一轮的接收，在中断或tasklet中dev_alloc_skb一个1514字节的skb
将sk_buff的head和fragmentation dma_map_single得到物理地址，将物理地址和长度写入描述符
开启dma使能，进行接收

测试

feth0为fpga网卡，设置ip为192.168.1.208；电脑网卡配置成百兆全双工，ip设置为192.168.1.108。

root@NanoPC-T4:/home/pi# ifconfig
eth0: flags=4163<UP,BROADCAST,RUNNING,MULTICAST>  mtu 1500
        inet 192.168.31.131  netmask 255.255.255.0  broadcast 192.168.31.255
        inet6 fe80::2c2b:6887:1120:373c  prefixlen 64  scopeid 0x20<link>
        ether fa:f1:04:39:02:9a  txqueuelen 1000  (Ethernet)
        RX packets 739  bytes 60003 (58.5 KiB)
        RX errors 0  dropped 0  overruns 0  frame 0
        TX packets 600  bytes 150153 (146.6 KiB)
        TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0
        device interrupt 60  

feth0: flags=4163<UP,BROADCAST,RUNNING,MULTICAST>  mtu 1500
        inet 192.168.1.208  netmask 255.255.255.0  broadcast 192.168.1.255
        ether 00:00:00:00:00:00  txqueuelen 1000  (Ethernet)
        RX packets 35382  bytes 2069214 (1.9 MiB)
        RX errors 0  dropped 7  overruns 0  frame 0
        TX packets 65186  bytes 98674228 (94.1 MiB)
        TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0

lo: flags=73<UP,LOOPBACK,RUNNING>  mtu 65536
        inet 127.0.0.1  netmask 255.0.0.0
        inet6 ::1  prefixlen 128  scopeid 0x10<host>
        loop  txqueuelen 1000  (Local Loopback)
        RX packets 24  bytes 1944 (1.8 KiB)
        RX errors 0  dropped 0  overruns 0  frame 0
        TX packets 24  bytes 1944 (1.8 KiB)
        TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0

ping测试

ping 20000包长时，ICMP包分成了13个包发送，且延迟很长4ms，抓包正常

root@NanoPC-T4:/home/pi# ping 192.168.1.108
PING 192.168.1.108 (192.168.1.108) 56(84) bytes of data.
64 bytes from 192.168.1.108: icmp_seq=1 ttl=128 time=1.05 ms
64 bytes from 192.168.1.108: icmp_seq=2 ttl=128 time=0.992 ms
64 bytes from 192.168.1.108: icmp_seq=3 ttl=128 time=0.876 ms
64 bytes from 192.168.1.108: icmp_seq=4 ttl=128 time=1.01 ms
64 bytes from 192.168.1.108: icmp_seq=5 ttl=128 time=0.901 ms
64 bytes from 192.168.1.108: icmp_seq=6 ttl=128 time=1.02 ms
64 bytes from 192.168.1.108: icmp_seq=7 ttl=128 time=0.930 ms
^C
--- 192.168.1.108 ping statistics ---
7 packets transmitted, 7 received, 0% packet loss, time 6011ms
rtt min/avg/max/mdev = 0.876/0.968/1.051/0.061 ms
root@NanoPC-T4:/home/pi# ping -s 20000 192.168.1.108
PING 192.168.1.108 (192.168.1.108) 20000(20028) bytes of data.
20008 bytes from 192.168.1.108: icmp_seq=1 ttl=128 time=4.23 ms
20008 bytes from 192.168.1.108: icmp_seq=2 ttl=128 time=3.93 ms
20008 bytes from 192.168.1.108: icmp_seq=3 ttl=128 time=4.32 ms
20008 bytes from 192.168.1.108: icmp_seq=4 ttl=128 time=3.95 ms
20008 bytes from 192.168.1.108: icmp_seq=5 ttl=128 time=4.21 ms
20008 bytes from 192.168.1.108: icmp_seq=6 ttl=128 time=4.01 ms
^C
--- 192.168.1.108 ping statistics ---
6 packets transmitted, 6 received, 0% packet loss, time 5010ms
rtt min/avg/max/mdev = 3.930/4.107/4.324/0.152 ms

基于XDMA的简易FPGA网卡实现（一）,linux驱动开发经验,FPGA,fpga开发,驱动开发