FP64、FP32、FP16、FP8简介

这篇具有很好参考价值的文章主要介绍了FP64、FP32、FP16、FP8简介。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目录

1、单精度浮点数FP32的表示

2、半精度浮点数FP16的表示

3、双精度浮点数FP64的表示

4、FP8

5、写在最后


1、单精度浮点数FP32的表示

浮点数由三部分组成:符号位、指数部分、尾数部分

以单精度浮点数为例,如图所示,符号位为1bit、指数位8bit、尾数位23bit

fp32,fpga开发

表达方式如下:

−1𝑠𝑖𝑔𝑛 × 2𝑒𝑥𝑝𝑜𝑛𝑒𝑛𝑡 −𝑏𝑖𝑎𝑠 ×1.𝑚𝑎𝑛𝑡𝑖𝑠𝑠𝑎

其中bias决定了数的取值范围,默认值为127 

exponent-bias表示对1.𝑚𝑎𝑛𝑡𝑖𝑠𝑠𝑎小数点右移的位数 

为什么是1.𝑚𝑎𝑛𝑡𝑖𝑠𝑠𝑎而不是0.𝑚𝑎𝑛𝑡𝑖𝑠𝑠𝑎、或者0. 0 𝑚𝑎𝑛𝑡𝑖𝑠𝑠𝑎呢?

举个例子,十进制整数17可以表示为:1 × 25 × (0.10001)2,也可以表示为:1 × 26 × (0.010001)2

这样就给计算机处理增加了复杂性,为了同一表示,规定尾数部分最高位必须是1,也就是说尾数必须以0.1开头,对指数做相应的调整,这称为正规化(Normalize)。由于尾数部分的最高位必须是1,这个1就不必保存了,可以节省出一位来用于提高精度,我们说最高位的1是隐含的(Implied)。

因此,十进制整数17表示为

fp32,fpga开发

即:

1 × 24 × (1.0001)2

一些特殊情况:

1)exponent=0,且mantissa=0;表示数字0

2)exponent=0,且mantissa != 0;表示一个非常小的数

3)exponent=全f,且mantissa=0;表示无穷大。如果符号位为0,表示正无穷;如果符号位为1,表示负无穷

4)exponent=0,且mantissa != 0;非法。

举例:对于十进制数3.25,单精度浮点数如何表示?

0 10000000 10100000000000000000000

如图:

fp32,fpga开发

Sign=0

Exponent = 10000000(二进制)/128(十进制)

Bias = 127

Exponent - Bias = 1(小数点右移1位) 

1.𝑚𝑎𝑛𝑡𝑖𝑠𝑠𝑎=1.101

小数点移位后:(11.01)2

1 × 21 + 1 × 20+0 × 2−1+ 1 × 2−2 =  2 + 1 + 0 + 0.25 = 3.25

2、半精度浮点数FP16的表示

单精度浮点数除了exponent和mantissa的长度、bias的值外,其余和单精度浮点数都一样

如图所示:

fp32,fpga开发

符号位为1bit、指数位5bit、尾数位10bit

Bias = 15

3、双精度浮点数FP64的表示

符号位为1bit、指数位11bit、尾数位52bit

Bias = 1023

4、FP8

FP8首次出现在2022年4月,Nvidia 发布的最新一代高性能GPU架构:H100。H100 TensorCore中引入了一种新的浮点类型FP8

如图所示:

fp32,fpga开发

有两种形式,E5M2和E4M3,对于E5M2,指数位5bit、尾数位2bit

bias的值和对应的FP8所能表示的数的取值范围如下表:

fp32,fpga开发

对于E4M3,指数位4bit、尾数位3bit

bias的值和对应的FP8所能表示的数的取值范围如下表:

fp32,fpga开发

5、写在最后

1)小程序

根据IEEE-754标准,十进制、十六进制、二进制、FP32转化

IEEE-754 Floating Point Converter (h-schmidt.net)

2)思考:FP64、FP32、FP16、FP8之间如何转换?

3)FP8、FP16数据规格可见:

https://download.csdn.net/download/weixin_42330305/86662920文章来源地址https://www.toymoban.com/news/detail-780699.html

到了这里,关于FP64、FP32、FP16、FP8简介的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • FP-Growth算法全解析:理论基础与实战指导

    本篇博客全面探讨了FP-Growth算法,从基础原理到实际应用和代码实现。我们深入剖析了该算法的优缺点,并通过Python示例展示了如何进行频繁项集挖掘。 关注TechLead,分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验,同济本复旦硕,复旦机器

    2024年02月05日
    浏览(47)
  • 实例分割计算指标TP,FP,FN,F1(附代码)

    目录 源代码: 返回值  我使用的groundTruth图像:  预测图像    基于IOU的F1是评价模型实例分割能力的一种评价指标,该指标在2018年的Urban 3D Challenge和2020年的阿里天池建筑智能普查竞赛中作为评价标准。 计算公式如下: 其余计算指标: 1、IoU:  交并比,两个区域重叠的部分

    2024年02月07日
    浏览(124)
  • FP独立站支付问题你还没解决?out了!

    目前FP独立站是很多跨境卖家的变现方式,但是这类外贸电商会遇到一些收款问题,这些问题很容易就让卖家的资金被冻结、账号被风控、关联账号被限制,损失真是不小。那FP卖家的收款问题该怎么解决呢?往下看。 一、FP独立站常见收款方式 1.沃尔玛和PayPal的合作通道,要

    2024年02月06日
    浏览(43)
  • FP7195转模拟恒流调光芯片在机器视觉光源的应用优势

    机器视觉是人工智能正在快速发展的一个分支。简单说来,机器视觉就是用机器代替人眼来做测量和判断。照明是影响机器视觉系统输入的重要因素,它直接影响输入数据的质量和应用效果。随着计算能力的增强,更高分辨率的传感器的迭代,更快的扫描率和软件功能的提高

    2024年02月03日
    浏览(132)
  • 前端vite+vue3——可视化页面性能耗时指标(fmp、fp)

    大家好,我是yma16,本文分享关于 前端vite+vue3——可视化页面性能耗时(fmp、fp)。 fmp的定义 FMP(First Meaningful Paint)是一种衡量网页加载性能的指标。它表示在加载过程中,浏览器首次渲染出有意义的内容所花费的时间。有意义的内容指的是用户可以看到和交互的元素,如

    2024年03月19日
    浏览(62)
  • 浅谈语义分割、图像分类与目标检测中的TP、TN、FP、FN

    TP:正确地预测出了正类,即原本是正类,识别的也是正类 TN:正确地预测出了负类,即原本是负类,识别的也是负类 FP:错误地预测为了正类,即原本是负类,识别的是正类 FN:错误地预测为了负类,即原本是正类,识别成了负类 代码可见:一整套计算correct, labeled, inter,

    2024年02月19日
    浏览(46)
  • 关联规则算法(Apriori算法、FP-Growth算法)小案例(python mlxtend)

    目录 一、Apriori  二、FP-Growth 算法理论部分参考: (28条消息) Apriori算法与FP-Tree算法_messi_james的博客-CSDN博客 参考: (28条消息) 【机器学习】关联规则及python实现_mlxtend.frequent_patterns_为什么昵称不能重复的博客-CSDN博客

    2024年02月13日
    浏览(58)
  • FP7195转模拟调光技术解决智能家居调光频闪和电感噪音的原理

    科技发展的今天,照明产品需要根据使用者的要求对产品进行调光和混色。调光有多种方式,其中,控制LED亮灯时间及熄灯时间长度的方式称为PWM调光。PWM方式调光系统的优点在于,调光引起的色度变化较少。PWM调光通过固定频率使DC-DC转换器进行间歇工作,并通过反复进行

    2024年02月06日
    浏览(92)
  • PWM调光 降压恒流LED芯片FP7127:为照明系统注入新能量(台灯、GBR、调光电源、汽车大灯)

    目录 一、降压恒流LED芯片FP7127 二、降压恒流LED芯片FP7127具有以下特点: 三、降压恒流LED芯片FP7127应用领域: LED照明和调光的新纪元随着LED照明技术的不断发展,人们对于照明调光的需求也越来越高。PWM调光技术作为一种常用的调光方法,可以实现灯光的亮度可调节,而降压

    2024年01月25日
    浏览(63)
  • FP7195芯片PWM转模拟调光至0.1%低亮度时恒流一致性的控制原理

    在 传统模拟调光原理 中,Dimming讯号会转换出VOFFSET电压跨在VFB与VCS中间,所以当调整Dimming讯号时候即可调整输出电流值ILED=VCS/RCS。用FP7102举例,在规格书上的 VFB规格为250mV±5mV (以下计算忽略电阻以及Dimming讯号源误差)  当调光20%亮度的时候,VOFFSET电压为0.2V,所以VFB-VOFFSET

    2024年02月05日
    浏览(86)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包