带你彻底了解浮点型数据的存储
创始人
2024-05-26 12:04:40
0

🚀🚀🚀大家觉不错的话,就恳求大家点点关注,点点小爱心,指点指点🚀🚀🚀 

目录

🐰浮点型在内存的存储

🤔提示:数据类型的存储范围

🌸浮点型的类型:

✈️引入:

🐰浮点型数据存储的规则

🌸有效位数字M的规定

🌸10进制的小数转换成2进制的小数

🌸指数E的规定

🌸引入的解读


🐰浮点型在内存的存储

🤔提示:数据类型的存储范围

整形家族的类型的取值范围:放在limits.h的文件 浮点型类型的取值范围:放在float.h的文件

🌸浮点型的类型:

float:单精度浮点型         double:双精度浮点型 long double:更高精度的浮点型(不常用)

✈️引入:

浮点型存储的例子
#include
int main()
{int n=9;float* pFloat=(float*)&n;printf("n的值为:%d\n",n);printf("pFloat的值为:%f\n",*pFloat);*pFloat=9.0;printf("num的值为:%d\n",n);printf("pFloat的值为:%f\n",n);
}
结果为: n的值为:9 pFloat的值为:0.000000 num的值为:1091567616 pFloat的值为:0.000000

🐰浮点型数据存储的规则

num和*pFloat在内存中明明是同一个数,为什么浮点数和整数的解读结果会差别这么大? 根据国际标准IEEE(电气和电子工程协会)754,任意一个二进制浮点数V可以表示成下面的形式:
(-1)^S*M*(2^E)
(-1)^S表示符号位,当S=0,V为正数;当S=1,V为负数
M表示有效数字,大于等于1,小于2
2^E表示指数位
举例来说:
十进制的5.0,写成二进制是101.0,相当于1.01*2^2
可以得出S=0,M=1.01,E=2
十进制的-5.0,写成二进制是-101.0,相当于-1.01*2^2
可以得出S=1,M=1.01,E=2

再例如:5.5

V=5.5=(-1)^0*1.011*2^2 S=0 M=1.011 E=2 IEEE 754规定: float(单精度浮点型) 32位的浮点型 对于32位的浮点数,最高的1位是符号位S,接着的8位是指数E,剩下的23位为有效数字M

double(双精度浮点型) 64位的浮点型 对于64位的浮点数,最高的1位是符号位S,接着的11位是指数E,剩下的52位为有效数字M

IEEE 754对有效数字M和指数E,还有一些特别的规定

🌸有效位数字M的规定

前面说过1<=M<2,也就是说,M可以写成1.xxxxxx的形式,其中xxxxxx表示小数部分。 IEEE 754规定,在计算机内部保存M时,默认这个数的第一位总是1,因此可以舍去,只保存后面的xxxxxx部分。比如保存1.01的时候,只保存01,等到读取的时候,在把第一位加上去。这样做的目的,节省1位有效数字。以32位浮点数为例,留给M只有23位,将第一位的1舍去后,等于可以保存24位有效数字

🌸10进制的小数转换成2进制的小数

10进制的小数乘以2,算出乘积,取出乘积的整数部分,再用2乘以余下的小数部分,又可以得到一个乘积,再取出乘积的整数部分,如此进行,直到乘积中的小数部分为零,或者达到所要求的精度为止。然后把取出的整数部分按顺序排列起来。 先取的整数作为高位,后取的整数作为低位。
0.6875 *2 取出整数部分 高位
1.3750 *2 1
0.7500 *2 0
1.5000 *2 1
1.0000 1 低位
所以 0.6875(10)=0.1011(2)
或者达到所要求的精度为止,这句话的意思:不是所有的10进制数都可以完全转化为二进制数,例如:0.3
0.3 *2 取出整数部分 高位
0.6 *2 0
1.2 *2 1
0.4 *2 0
0.8 *2 0
1.6 *2 1
1.2 *2 1
0.4 *2 0
... ... 低位
所以 0.3(10)不能完全转化为二进制的数,可以根据精度,取接近0.3的值
再例如:5.3
#include
int main()
{float n=5.3;printf("%.10f",n);return 0;
}
打印出来的值为5.3000001907

🌸指数E的规定

首先,E为一个无符号整数(unsigned int) 这意味着,如果E为8位,它的取值范围为0~255;如果E为11位,它的取值范围为0~2047.但是我们知道,科学计数法中的E可以是负数,所以IEEE 754规定,存入内存时的E的真实值必须再加上一个中间数,对于8位的E,这个中间数是127,对于11位的E,这个中间数是1023。 比如,2^10的E是10,所以保存32位浮点数时,必须保存成10+127=137,即,10001001(无符号数) E的范围为-127~128 5.5的表示,以32位为例
#include
int main()
{float n=5.5f;//5.5的二进制表示形式:101.1//V=5.5=(-1)^0*1.011*2^2//S:0   E:2(在内存存储的是2+127=129 二进制为:10000001) M:1.011(内存中真实存储的是011)//所以内存中存储的是0 10000001 01100000000000000000000//十六进制为40b00000return 0;
}
E从内存中取出,也得分三种情况 E不全为0或不全为1(我们常见的情况) 这时,浮点数就采用下面的规则表示,即指数E的计算值减去127(或1023),得到真实值,再将有效数字M前加第一位的1 比如:0.5的二进制形式为0.1,由于规定正数部分必须为1,即将小数点右移1位,则为(-1)^0*1.0*2^(-1),E真实存储为-1+127=126,表示为01111110,而尾数1.0去掉整数部分为0,补齐0到23位00000000000000000000000,则其二进制表示形式为:0 01111110 00000000000000000000000 E全为0 这时,浮点数的指数E等于1-127(或者1-1023)即为真实值,有效数字M不再加上第一位的1,而是还原为0.xxxxxx的小数。这样做是为了表示+-0,以及接近于0的很小的数字 E全为1 表示+-无穷大的数(+-取决于符号位s)

🌸引入的解读

#include
int main()
{int n=9;//00000000000000000000000000001001-9的补码//S:0 E:00000000 M:00000000000000000001001//E=1-127=-126//M=0.00000000000000000001001//(-1)^0*0.00000000000000000001001*2^-126float* pFloat=(float*)&n;printf("n的值为:%d\n",n);printf("pFloat的值为:%f\n",*pFloat);*pFloat=9.0;//00000000000000000000000000001001-9的补码//1.001*2^3//V=(-1)^0*1.001*2^3//s:0 E:3(存储的 3+127=130) M:00100000000000000000000//0 10000010 00100000000000000000000printf("num的值为:%d\n",n);//如果以整形打印的话,就会把 0 10000010 00100000000000000000000直接当成补码,打印出来,结果为1091567616printf("pFloat的值为:%f\n",n);return 0;
}

这样就可以理解打印的值为:

n的值为:9 pFloat的值为:0.000000 num的值为:1091567616 pFloat的值为:0.000000

🌸🌸🌸如果大家还有不懂或者建议都可以发在评论区,我们共同探讨,共同学习,共同进步。谢谢大家! 🌸🌸🌸     

相关内容

热门资讯

监控摄像头接入GB28181平... 流程简介将监控摄像头的视频在网站和APP中直播,要解决的几个问题是:1&...
Windows10添加群晖磁盘... 在使用群晖NAS时,我们需要通过本地映射的方式把NAS映射成本地的一块磁盘使用。 通过...
protocol buffer... 目录 目录 什么是protocol buffer 1.protobuf 1.1安装  1.2使用...
在Word、WPS中插入AxM... 引言 我最近需要写一些文章,在排版时发现AxMath插入的公式竟然会导致行间距异常&#...
【PdgCntEditor】解... 一、问题背景 大部分的图书对应的PDF,目录中的页码并非PDF中直接索引的页码...
修复 爱普生 EPSON L4... L4151 L4153 L4156 L4158 L4163 L4165 L4166 L4168 L4...
Fluent中创建监测点 1 概述某些仿真问题,需要创建监测点,用于获取空间定点的数据࿰...
educoder数据结构与算法...                                                   ...
MySQL下载和安装(Wind... 前言:刚换了一台电脑,里面所有东西都需要重新配置,习惯了所...
MFC文件操作  MFC提供了一个文件操作的基类CFile,这个类提供了一个没有缓存的二进制格式的磁盘...