主頁 > 軟體設計 > 面試官:為什么 0.1 + 0.2 == 0.300000004 ?

面試官:為什么 0.1 + 0.2 == 0.300000004 ?

2021-04-22 11:27:09 軟體設計

我們在 JavaScript 里執行 0.1 + 0.2,會得到下面這個結果:

那今天,我們來思考幾個問題:

  • 為什么負數要用補碼表示?
  • 十進制小數怎么轉成二進制?
  • 計算機是怎么存小數的?
  • 0.1 + 0.2 == 0.3 嗎?

別看這些問題都看似簡單,但是其實還是有點東西的這些問題,


為什么負數要用補碼表示?

十進制轉換二進制的方法相信大家都熟能生巧了,如果你說你還不知道,我覺得你還是太謙虛,可能你只是忘記了,即使你真的忘記了,不怕,貼心的小林在和你一起回憶一下,

十進制數轉二進制采用的是除 2 取余法,比如數字 8 轉二進制的程序如下圖:

接著,我們看看「整數型別」的數字在計算機的存盤方式,這其實很簡單,也很直觀,就是將十進制的數字轉換成二進制即可,

我們以 int 型別的數字作為例子,int 型別是 32 位的,其中最高位是作為「符號標志位」,正數的符號位是 0,負數的符號位是 1剩余的 31 位則表示二進制資料

那么,對于 int 型別的數字 1 的二進制數表示如下:

而負數就比較特殊了點,負數在計算機中是以「補碼」表示的,所謂的補碼就是把正數的二進制全部取反再加 1,比如 -1 的二進制是把數字 1 的二進制取反后再加 1,如下圖:

不知道你有沒有想過,為什么計算機要用補碼的方式來表示負數?在回答這個問題前,我們假設不用補碼的方式來表示負數,而只是把最高位的符號標志位變為 1 表示負數,如下圖程序:

如果采用這種方式來表示負數的二進制的話,試想一下 -2 + 1 的運算程序,如下圖:

按道理,-2 + 1 = -1,但是上面的運算程序中得到結果卻是 -3,所可以發現,這種負數的表示方式是不能用常規的加法來計算了,就需要特殊處理,要先判斷數字是否為負數,如果是負數就要把加法操作變成減法操作才可以得到正確對結果,

到這里,我們就可以回答前面提到的「負數為什么要用補碼方式來表示」的問題了,

如果負數不是使用補碼的方式表示,則在做基本對加減法運算的時候,還需要多一步操作來判斷是否為負數,如果為負數,還得把加法反轉成減法,或者把減法反轉成加法,這就非常不好了,畢竟加減法運算在計算機里是很常使用的,所以為了性能考慮,應該要盡量簡化這個運算程序,

而用了補碼的表示方式,對于負數的加減法操作,實際上是和正數加減法操作一樣的,你可以看到下圖,用補碼表示的負數在運算 -2 + 1 程序的時候,其結果是正確的:


十進制小數與二進制的轉換

好了,整數十進制轉二進制我們知道了,接下來看看小數是怎么轉二進制的,小數部分的轉換不同于整數部分,它采用的是乘 2 取整法,將十進制中的小數部分乘以 2 作為二進制的一位,然后繼續取小數部分乘以 2 作為下一位,直到不存在小數為止,

話不多說,我們就以 8.625 轉二進制作為例子,直接上圖:

最后把「整數部分 + 小數部分」結合在一起后,其結果就是 1000.101

但是,并不是所有小數都可以用二進制表示,前面提到的 0.625 小數是一個特例,剛好通過乘 2 取整法的方式完整的轉換成二進制,如果我們用相同的方式,來把 0.1 轉換成二進制,程序如下:

可以發現,0.1 的二進制表示是無限回圈的,由于計算機的資源是有限的,所以是沒辦法用二進制精確的表示 0.1,只能用「近似值」來表示,就是在有限的精度情況下,最大化接近 0.1 的二進制數,于是就會造成精度缺失的情況

對于二進制小數轉十進制時,需要注意一點,小數點后面的指數冪是負數,比如二進制 0.1 轉成十進制就是 2^(-1),也就是十進制 0.5,二進制 0.01 轉成十進制就是 2^-2,也就是十進制 0.25,以此類推,

舉個例子,二進制 1010.101 轉十進制的程序,如下圖:


計算機是怎么存小數的?

1000.101 這種二進制小數是「定點數」形式,代表著小數點是定死的,不能移動,如果你移動了它的小數點,這個數就變了, 就不再是它原來的值了,

然而,計算機并不是這樣存盤的小數的,計算機存盤小數的采用的是浮點數,名字里的「浮點」表示小數點是可以浮動的,比如 1000.101 這個二進制數,可以表示成 1.000101 x 2^(-3),類似于數學上的科學記數法,

既然提到了科學計數法,我再幫大家復習一下,比如有個很大的十進制數 1230000,我們可以也可以表示成 1.23 x 10^6,這種方式就稱為科學記數法,該方法在小數點左邊只有一個數字,而且把這種整數部分沒有前導 0 的數字稱為規格化,比如 1.0 x 10^(-9) 是規格化的科學記數法,而 0.1 x 10^(-9)10.0 x 10^(-9) 就不是了,

因此,如果二進制要用到科學記數法,同時要規范化,那么不僅要保證基數為 2,還要保證小數點左側只有 1 位,而且必須為 1,所以通常將 1000.101 這種二進制數,表示成 1.000101 x 2^(-3),其中,最為關鍵的是 000101 和 -3 這兩個東西,它就可以包含了這個二進制小數的所有資訊,000101 稱為尾數,即小數點后面的數字,-3 稱為指數,指定了小數點在資料中的位置,

現在絕大多數計算機使用的浮點數,一般采用的是 IEEE 制定的國際標準,這種標準形式如下圖:

這三個重要部分的意義如下:

  • 符號位:表示數字是正數還是負數,為 0 表示正數,為 1 表示負數;
  • 指數位:指定了小數點在資料中的位置,指數可以是負數,也可以是正數,指數位的長度越長則數值的表達范圍就越大
  • 尾數位:小數點右側的數字,也就是小數部分,比如二進制 1.0011 x 2^(-2),尾數部分就是 0011,而且尾數的長度決定了這個數的精度,因此如果要表示精度更高的小數,則就要提高尾數位的長度;

32 位來表示的浮點數,則稱為單精度浮點數,也就是我們編程語言中的 float 變數,而用 64 位來表示的浮點數,稱為雙精度浮點數,也就是 double 變數,它們的結構如下:

可以看到:

  • double 的尾數部分是 52 位,float 的尾數部分是 23 位,由于同時都帶有一個固定隱含位(這個后面會說),所以 double 有 53 個二進制有效位,float 有 24 個二進制有效位,所以所以它們的精度在十進制中分別是 log10(2^53) 約等于 15.95log10(2^24) 約等于 7.22 位,因此 double 的有效數字是 15~16 位,float 的有效數字是 7~8 位,這些是有效位是包含整數部分和小數部分;
  • double 的指數部分是 11 位,而 float 的指數位是 8 位,意味著 double 相比 float 能表示更大的數值范圍;

那二進制小數,是如何轉換成二進制浮點數的呢?我們就以 10.625 作為例子,看看這個數字在 float 里是如何存盤的,

首先,我們計算出 10.625 的二進制小數為 1010.101,然后把小數點,移動到第一個有效數字后面,即將 1010.101 右移 3 位成 1.010101,右移 3 位就代表 +3,左移 3 位就是 -3,float 中的「指數位」就跟這里移動的位數有關系,把移動的位數再加上「偏移量」,float 的話偏移量是 127,相加后就是指數位的值了,即指數位這 8 位存的是 10000010(十進制 130),因此你可以認為「指數位」相當于指明了小數點在資料中的位置,

1.010101小數點右側的數字就是 float 里的「尾數位」,由于尾數位是 23 位,則后面要補充 0,所以最終尾數位存盤的數字是 01010100000000000000000

在算指數的時候,你可能會有疑問為什么要加上偏移量呢?

前面也提到,指數可能是正數,也可能是負數,即指數是有符號的整數,而有符號整數的計算是比無符號整數麻煩的,所以為了減少不必要的麻煩,在實際存盤指數的時候,需要把指數轉換成無符號整數,float 的指數部分是 8 位,IEEE 標準規定單精度浮點的指數取值范圍是 -126 ~ +127,于是為了把指數轉換成無符號整數,就要加個偏移量,比如 float 的指數偏移量是 127,這樣指數就不會出現負數了,

比如,指數如果是 8,則實際存盤的指數是 8 + 127 = 135,即把 135 轉換為二進制之后再存盤,而當我們需要計算實際的十進制數的時候,再把指數減去偏移量即可,

細心的朋友肯定發現,移動后的小數點左側的有效位(即 1)消失了,它并沒有存盤到 float 里,這是因為 IEEE 標準規定,二進制浮點數的小數點左側只能有 1 位,并且還只能是 1,既然這一位永遠都是 1,那就可以不用存起來了,于是就讓 23 位尾數只存盤小數部分,電路在計算時會自動把這個 1 加上,這樣就可以節約 1 位的空間,尾數就能多存一位小數,相應的精度就更高了一點,

那么,對于我們在從 float 的二進制浮點數轉換成十進制時,要考慮到這個隱含的 1,轉換公式如下:

舉個例子,我們把下圖這個 float 的資料轉換成十進制,程序如下:


0.1 + 0.2 == 0.3 ?

前面提到過,并不是所有小數都可以用「完整」的二進制來表示的,比如十進制 0.1 在轉換成二進制小數的時候,是一串無限回圈的二進制數,計算機是無法表達無限回圈的二進制數的,畢竟計算機的資源是有限,

因此,計算機只能用「近似值」來表示該二進制,那么意味著計算機存放的小數可能不是一個真實值,現在基本都是用 IEEE 754 規范的單精度浮點型別或雙精度浮點型別來存盤小數的,根據精度的不同,近似值也會不同,

那計算機是存盤 0.1 是一個怎么樣的二進制浮點數呢?偷個懶,我就不自己手動算了,可以使用 binaryconvert 這個工具,將十進制 0.1 小數轉換成 float 浮點數:

可以看到,8 位指數部分是 01111011,23 位的尾數部分是 10011001100110011001101,可以看到尾數部分是 0011 是一直回圈的,只不過尾數是有長度限制的,所以只會顯示一部分,所以是一個近似值,精度十分有限,

接下來,我們看看 0.2 的 float 浮點數:

可以看到,8 位指數部分是 01111100,稍微和 0.1 的指數不同,23 位的尾數部分是 10011001100110011001101 和 0.1 的尾數部分是相同的,也是一個近似值,

0.1 的二進制浮點數轉換成十進制的結果是 0.100000001490116119384765625

0.2 的二進制浮點數轉換成十進制的結果是 0.20000000298023223876953125

這兩個結果相加就是 0.300000004470348358154296875

所以,你會看到在計算機中 0.1 + 0.2 并不等于完整的 0.3,這主要是因為有的小數無法可以用「完整」的二進制來表示,所以計算機里只能采用近似數的方式來保存,那兩個近似數相加,得到的必然也是一個近似數,

我們在 JavaScript 里執行 0.1 + 0.2,你會得到下面這個結果:

結果和我們前面推到的類似,因為 JavaScript 對于數字都是使用 IEEE 754 標準下的雙精度浮點型別來存盤的,而我們二進制只能精準表達 2 除盡的數字 1/2, 1/4, 1/8,但是例如 0.1(1/10) 和 0.2(1/5),在二進制中都無法精準表示時,需要根據精度舍入,

我們人類熟悉的十進制運算系統,可以精準表達 2 和 5 除盡的數字,例如1/2, 1/4, 1/5(0.2), 1/8, 1/10(0.1),當然,十進制也有無法除盡的地方,例如 1/3, 1/7,也需要根據精度舍入,


總結

最后,再來回答開頭多問題,

為什么負數要用補碼表示?

負數之所以用補碼的方式來表示,主要是為了統一和正數的加減法操作一樣,畢竟數字的加減法是很常用的一個操作,就不要搞特殊化,盡量以統一的方式來運算,

十進制小數怎么轉成二進制?

十進制整數轉二進制使用的是「除 2 取余法」,十進制小數使用的是「乘 2 取整法」,

計算機是怎么存小數的?

計算機是以浮點數的形式存盤小數的,大多數計算機都是 IEEE 754 標準定義的浮點數格式,包含三個部分:

  • 符號位:表示數字是正數還是負數,為 0 表示正數,為 1 表示負數;
  • 指數位:指定了小數點在資料中的位置,指數可以是負數,也可以是正數,指數位的長度越長則數值的表達范圍就越大;
  • 尾數位:小數點右側的數字,也就是小數部分,比如二進制 1.0011 x 2^(-2),尾數部分就是 0011,而且尾數的長度決定了這個數的精度,因此如果要表示精度更高的小數,則就要提高尾數位的長度;

用 32 位來表示的浮點數,則稱為單精度浮點數,也就是我們編程語言中的 float 變數,而用 64 位來表示的浮點數,稱為雙精度浮點數,也就是 double 變數,

0.1 + 0.2 == 0.3 嗎?

不是的,0.1 和 0.2 這兩個數字用二進制表達會是一個一直回圈的二進制數,比如 0.1 的二進制表示為 0.0 0011 0011 0011… (0011 無限回圈),對于計算機而言,0.1 無法精確表達,這是浮點數計算造成精度損失的根源,

因此,計算機只能用「近似值」來表示該二進制,那么意味著計算機存放的小數可能不是一個真實值,

0.1 + 0.2 并不等于完整的 0.3,這主要是因為這兩個小數無法用「完整」的二進制來表示,所以計算機里只能采用近似數的方式來保存,那兩個近似數相加,得到的必然也是一個近似數,


作者簡介:大家好,我是小林,一個專為大家圖解的工具人,微信搜索「小林coding」,關注專注于圖解計算機基礎的我,寫了很多原創的圖解系列文章,如圖解網路、圖解系統、圖解資料庫等等,這么賣力的圖解,當然是希望大家能學起來不會枯燥,小林期待你的關注,和我一起熱氣騰騰的成長,

轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/278910.html

標籤:其他

上一篇:Python帶你聊天式走完Hadoop之MapReduce——史上最詳細的操作步驟【內附hdfs操作合集】

下一篇:MySQL資料庫 高可用集群方案

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 面試突擊第一季,第二季,第三季

    第一季必考 https://www.bilibili.com/video/BV1FE411y79Y?from=search&seid=15921726601957489746 第二季分布式 https://www.bilibili.com/video/BV13f4y127ee/?spm_id_fro ......

    uj5u.com 2020-09-10 05:35:24 more
  • 第三單元作業總結

    1.前言 這應該是本學期最后一次寫作業總結了吧。總體來說,對作業的節奏也差不多掌握了,作業做起來的效率也更高了。雖然和之前的作業一樣,作業中都要用到新的知識,但是相比之前,更加懂得了如何利用工具以及資料。雖然之間卡過殼,但總體而言,這幾次作業還算完成的比較好。 2.作業程序總結 相比前兩個單元,此單 ......

    uj5u.com 2020-09-10 05:35:41 more
  • 北航OO(2020)第四單元博客作業暨課程總結博客

    北航OO(2020)第四單元博客作業暨課程總結博客 本單元作業的架構設計 在本單元中,由于UML圖具有比較清晰的樹形結構,因此我對其中需要進行查詢操作的元素進行了包裝,在樹的父節點中存盤所有孩子的參考。考慮到性能問題,我采用了快取機制,一次查詢后盡可能快取已經遍歷過的資訊,以減少遍歷次數。 本單元我 ......

    uj5u.com 2020-09-10 05:35:48 more
  • BUAA_OO_第四單元

    一、UML決議器設計 ? 先看下題目:第四單元實作一個基于JDK 8帶有效性檢查的UML(Unified Modeling Language)類圖,順序圖,狀態圖分析器 MyUmlInteraction,實際上我們要建立一個有向圖模型,UML中的物件(元素)可能與同級元素連接,也可與低級元素相連形成 ......

    uj5u.com 2020-09-10 05:35:54 more
  • 6.1邏輯運算子

    邏輯運算子 1. && 短路與 運算式1 && 運算式2 01.運算式1為true并且運算式2也為true 整體回傳為true 02.運算式1為false,將不會執行運算式2 整體回傳為false 03.只要有一個運算式為false 整體回傳為false 2. || 短路或 運算式1 || 運算式2 ......

    uj5u.com 2020-09-10 05:35:56 more
  • BUAAOO 第四單元 & 課程總結

    1. 第四單元:StarUml檔案決議 本單元采用了圖模型決議UML。 UML檔案可以抽象為圖、子圖、邊的邏輯結構。 在實作中,圖的節點包括類、介面、屬性,子圖包括狀態圖、順序圖等。 采用了三次遍歷UML元素的方法建圖,第一遍遍歷建點,第二、三次遍歷設定屬性、連邊,實作圖物件的初始化。這里借鑒了一些 ......

    uj5u.com 2020-09-10 05:36:06 more
  • 談談我對C# 多型的理解

    面向物件三要素:封裝、繼承、多型。 封裝和繼承,這兩個比較好理解,但要理解多型的話,可就稍微有點難度了。今天,我們就來講講多型的理解。 我們應該經常會看到面試題目:請談談對多型的理解。 其實呢,多型非常簡單,就一句話:呼叫同一種方法產生了不同的結果。 具體實作方式有三種。 一、多載 多載很簡單。 p ......

    uj5u.com 2020-09-10 05:36:09 more
  • Python 資料驅動工具:DDT

    背景 python 的unittest 沒有自帶資料驅動功能。 所以如果使用unittest,同時又想使用資料驅動,那么就可以使用DDT來完成。 DDT是 “Data-Driven Tests”的縮寫。 資料:http://ddt.readthedocs.io/en/latest/ 使用方法 dd. ......

    uj5u.com 2020-09-10 05:36:13 more
  • Python里面的xlrd模塊詳解

    那我就一下面積個問題對xlrd模塊進行學習一下: 1.什么是xlrd模塊? 2.為什么使用xlrd模塊? 3.怎樣使用xlrd模塊? 1.什么是xlrd模塊? ?python操作excel主要用到xlrd和xlwt這兩個庫,即xlrd是讀excel,xlwt是寫excel的庫。 今天就先來說一下xl ......

    uj5u.com 2020-09-10 05:36:28 more
  • 當我們創建HashMap時,底層到底做了什么?

    jdk1.7中的底層實作程序(底層基于陣列+鏈表) 在我們new HashMap()時,底層創建了默認長度為16的一維陣列Entry[ ] table。當我們呼叫map.put(key1,value1)方法向HashMap里添加資料的時候: 首先,呼叫key1所在類的hashCode()計算key1 ......

    uj5u.com 2020-09-10 05:36:38 more
最新发布
  • 【中介者設計模式詳解】C/Java/JS/Go/Python/TS不同語言實作

    * 中介者模式是一種行為型設計模式,它可以用來減少類之間的直接依賴關系,
    * 將物件之間的通信封裝到一個中介者物件中,從而使得各個物件之間的關系更加松散。
    * 在中介者模式中,物件之間不再直接相互互動,而是通過中介者來中轉訊息。 ......

    uj5u.com 2023-04-20 08:20:47 more
  • 露天煤礦現場調研和交流案例分享

    他們集團的資訊化公司及研究院在一個礦區正在做智能礦山的統一平臺的 試點,專案投資大概1億,包括了礦山的各方面的內容,顯示得我們這次交流有點多余。他們2年前開始做智能礦山的規劃,有很多煤礦行業專家的加持,他們的描述是非常完美,但是去年底應該上線的平臺,現在還沒有看到影子。他們確實有很多場景需求,但是被... ......

    uj5u.com 2023-04-20 08:20:25 more
  • 《社區人員管理》實戰案例設計&個人案例分享

    設計是一個讓人夢想成真程序,開始編碼、測驗、除錯之前進行需求分析和架構設計,才能保證關鍵方面都做正確 ......

    uj5u.com 2023-04-20 08:20:17 more
  • 軟體架構生態化-多角色交付的探索實踐

    作為一個技術架構師,不僅僅要緊跟行業技術趨勢,還要結合研發團隊現狀及痛點,探索新的交付方案。在日常中,你是否遇到如下問題 “ 業務需求排期長研發是瓶頸;非研發角色感受不到研發技改提效的變化;引入ISV 團隊又擔心質量和安全,培訓周期長“等等,基于此我們探索了一種新的技術體系及交付方案來解決如上問題。 ......

    uj5u.com 2023-04-20 08:20:10 more
  • 【中介者設計模式詳解】C/Java/JS/Go/Python/TS不同語言實作

    * 中介者模式是一種行為型設計模式,它可以用來減少類之間的直接依賴關系,
    * 將物件之間的通信封裝到一個中介者物件中,從而使得各個物件之間的關系更加松散。
    * 在中介者模式中,物件之間不再直接相互互動,而是通過中介者來中轉訊息。 ......

    uj5u.com 2023-04-20 08:19:44 more
  • 露天煤礦現場調研和交流案例分享

    他們集團的資訊化公司及研究院在一個礦區正在做智能礦山的統一平臺的 試點,專案投資大概1億,包括了礦山的各方面的內容,顯示得我們這次交流有點多余。他們2年前開始做智能礦山的規劃,有很多煤礦行業專家的加持,他們的描述是非常完美,但是去年底應該上線的平臺,現在還沒有看到影子。他們確實有很多場景需求,但是被... ......

    uj5u.com 2023-04-20 08:19:07 more
  • 《社區人員管理》實戰案例設計&個人案例分享

    設計是一個讓人夢想成真程序,開始編碼、測驗、除錯之前進行需求分析和架構設計,才能保證關鍵方面都做正確 ......

    uj5u.com 2023-04-20 08:18:57 more
  • 軟體架構生態化-多角色交付的探索實踐

    作為一個技術架構師,不僅僅要緊跟行業技術趨勢,還要結合研發團隊現狀及痛點,探索新的交付方案。在日常中,你是否遇到如下問題 “ 業務需求排期長研發是瓶頸;非研發角色感受不到研發技改提效的變化;引入ISV 團隊又擔心質量和安全,培訓周期長“等等,基于此我們探索了一種新的技術體系及交付方案來解決如上問題。 ......

    uj5u.com 2023-04-20 08:18:49 more
  • 05單件模式

    #經典的單件模式 public class Singleton { private static Singleton uniqueInstance; //一個靜態變數持有Singleton類的唯一實體。 // 其他有用的實體變數寫在這里 //構造器宣告為私有,只有Singleton可以實體化這個類! ......

    uj5u.com 2023-04-19 08:42:51 more
  • 【架構與設計】常見微服務分層架構的區別和落地實踐

    軟體工程的方方面面都遵循一個最基本的道理:沒有銀彈,架構分層模型更是如此,每一種都有各自優缺點,所以請根據不同的業務場景,并遵循簡單、可演進這兩個重要的架構原則選擇合適的架構分層模型即可。 ......

    uj5u.com 2023-04-19 08:42:41 more