1 基本概念
1.1 算力单位
TOPS:指的是每秒钟可以执行的整数运算次数,它代表着计算机在处理图像、音频等任务时的处理能力。TOPS的单位是万亿次每秒(trillion operations per second)。一般是指整数运算能力INT8
。
TFLOPS:指的是每秒钟可以执行的浮点运算次数,它代表着计算机在处理科学计算、机器学习等任务时的处理能力。TFLOPS的单位是万亿次每秒(trillion floating point operations per second)。一般是指单精度性能FP32
。
MFLOPS:等于每秒一百万次浮点运算。(megaFLOPS)
GFLOPS:等于每秒十亿次浮点运算。(gigaFLOPS)
PFLOPS:等于每秒一千万亿次浮点运算。(petaFLOPS)
1.2 内存带宽
内存带宽是指从计算机主板到内存之间传输数据的速度。它通常用作衡量内存性能的指标之一,以确定计算机可以快速读取和写入内存中的数据量。
内存带宽的大小取决于内存总线的宽度和内存频率的乘积。例如,如果内存总线宽度为64位,内存频率为1600 MHz,则内存带宽为64位 x 1600 MHz = 12.8 GB/s。
内存带宽的大小会直接影响计算机的算力,因为它可以限制计算机能够快速读取和写入数据的数量。如果内存带宽不足,计算机可能需要等待更长的时间才能读取或写入数据,从而降低了计算机的效率。特别是在处理大规模数据集和运行需要大量内存的应用程序时,内存带宽的大小会更加重要。因此,在选择计算机配置时,需要考虑内存带宽和其他关键指标,以确保计算机能够满足特定的计算需求。
1.3 DMIPS
DMIPS(Dhrystone Million Instructions Per Second,每秒处理的百万级的机器语言指令数),描述的是 CPU 的运算能力。
自动驾驶多传感器融合的滤波算法,激光点云的配准算法,多数的路径规划和决策算法考验的都是 CPU 的运算能力。
1.4 ASIC
ASIC(Application-Specific Integrated Circuit)是指应用特定集成电路,是一种定制的、用于特定应用的集成电路。与通用集成电路(如微处理器)不同,ASIC是针对特定应用进行设计和制造的,可以优化电路的性能和功耗,从而满足特定应用的要求。ASIC通常用于高性能计算、通信、图形处理等领域。
ASIC设计需要经过电路设计、逻辑设计、物理设计、验证等多个步骤,因此制造成本较高,但在高端应用中可以获得很高的性能和可靠性。与FPGA相比,ASIC在性能、功耗和面积等方面都具有优势,但缺乏FPGA的灵活性和可编程性。
ASIC 加速器包括 CVP(Computer Vision Processors,计算机视觉处理器),DLA 和 MA(Multithreaded Accelerator,多线程加速器),其中 18 颗 CVP 是 Mobileye 的下一代针对传统计算机视觉算法设计的 ASIC 芯片。芯片整体的 AI 算力设计只有 24TOPS。
例如:Jetson中的DLA深度学习加速就是一种ASIC。
2 GeForce 30x系列
3 Jetson
文章来源:https://www.toymoban.com/news/detail-454748.html
参考1:AI芯片,自动驾驶里的「水浒卡」
参考2:芯参数文章来源地址https://www.toymoban.com/news/detail-454748.html
到了这里,关于【20230407】NVIDIA显卡算力、Jetson比较的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!