【20230407】NVIDIA显卡算力、Jetson比较-Toy模板网

这篇具有很好参考价值的文章主要介绍了【20230407】NVIDIA显卡算力、Jetson比较。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

1 基本概念

1.1 算力单位

TOPS：指的是每秒钟可以执行的整数运算次数，它代表着计算机在处理图像、音频等任务时的处理能力。TOPS的单位是万亿次每秒（trillion operations per second）。一般是指整数运算能力INT8。

TFLOPS：指的是每秒钟可以执行的浮点运算次数，它代表着计算机在处理科学计算、机器学习等任务时的处理能力。TFLOPS的单位是万亿次每秒（trillion floating point operations per second)。一般是指单精度性能FP32。

MFLOPS：等于每秒一百万次浮点运算。（megaFLOPS）

GFLOPS：等于每秒十亿次浮点运算。(gigaFLOPS)

PFLOPS：等于每秒一千万亿次浮点运算。(petaFLOPS)

1.2 内存带宽

内存带宽是指从计算机主板到内存之间传输数据的速度。它通常用作衡量内存性能的指标之一，以确定计算机可以快速读取和写入内存中的数据量。

内存带宽的大小取决于内存总线的宽度和内存频率的乘积。例如，如果内存总线宽度为64位，内存频率为1600 MHz，则内存带宽为64位 x 1600 MHz = 12.8 GB/s。

内存带宽的大小会直接影响计算机的算力，因为它可以限制计算机能够快速读取和写入数据的数量。如果内存带宽不足，计算机可能需要等待更长的时间才能读取或写入数据，从而降低了计算机的效率。特别是在处理大规模数据集和运行需要大量内存的应用程序时，内存带宽的大小会更加重要。因此，在选择计算机配置时，需要考虑内存带宽和其他关键指标，以确保计算机能够满足特定的计算需求。

1.3 DMIPS

DMIPS（Dhrystone Million Instructions Per Second，每秒处理的百万级的机器语言指令数），描述的是 CPU 的运算能力。

自动驾驶多传感器融合的滤波算法，激光点云的配准算法，多数的路径规划和决策算法考验的都是 CPU 的运算能力。

1.4 ASIC

ASIC（Application-Specific Integrated Circuit）是指应用特定集成电路，是一种定制的、用于特定应用的集成电路。与通用集成电路（如微处理器）不同，ASIC是针对特定应用进行设计和制造的，可以优化电路的性能和功耗，从而满足特定应用的要求。ASIC通常用于高性能计算、通信、图形处理等领域。

ASIC设计需要经过电路设计、逻辑设计、物理设计、验证等多个步骤，因此制造成本较高，但在高端应用中可以获得很高的性能和可靠性。与FPGA相比，ASIC在性能、功耗和面积等方面都具有优势，但缺乏FPGA的灵活性和可编程性。

ASIC 加速器包括 CVP（Computer Vision Processors，计算机视觉处理器），DLA 和 MA（Multithreaded Accelerator，多线程加速器)，其中 18 颗 CVP 是 Mobileye 的下一代针对传统计算机视觉算法设计的 ASIC 芯片。芯片整体的 AI 算力设计只有 24TOPS。

例如：Jetson中的DLA深度学习加速就是一种ASIC。