原文地址:http://www.php100.com/9/20/87255.html
寫入拷貝(Copy-on-write,簡稱COW)是一種計算機程式設計領域的優化策略,其核心思想是,如果有多個呼叫者(callers)同時要求相同資源(如記憶體或磁盤上的資料存盤),他們會共同獲取相同的指標指向相同的資源,直到某個呼叫者試圖修改資源的內容時,系統才會真正復制一份專用副本(private copy)給該呼叫者,而其他呼叫者所見到的最初的資源仍然保持不變,這程序對其他的呼叫者都是透明的(transparently),此作法主要的優點是如果呼叫者沒有修改該資源,就不會有副本(private copy)被創建,因此多個呼叫者只是讀取操作時可以共享同一份資源,
PHP中的COW
注意:以下代碼基于PHP5.6,PHP7之后參考計數機制有變化,
大家都知道,PHP是由C實作的,可是C是強型別語言,PHP怎么做到弱型別語言,一起來看下,PHP變數在C語言底層中的代碼:
typedef struct _zval_struct zval; typedef unsigned int zend_uint; typedef unsigned char zend_uchar; struct _zval_struct { zvalue_value value; /*注意這里,這個里面存的才是變數的值*/ zend_uint refcount__gc; /*參考計數*/ zend_uchar type; /* 變數當前的資料型別 */ zend_uchar is_ref__gc; /*變數是否參考*/ }; typedef union _zvalue_value { long lval; /*PHP中整型的值*/ double dval; /*PHP的浮點數值*/ struct { char *val; int len; } str; /*PHP的字串*/ HashTable *ht; /*陣列*/ zend_object_value obj; /*物件*/ } zvalue_value;
PHP的變數,低層是一個結構體zval,里面的zvalue_value結構體實際上是個聯合體,這個聯合體才是實際存放著PHP的變數值, Zend引擎為了區別同一個zval地址是否被多個變數共享,引入了ref_count和is_ref兩個變數進行標識,
運行以下代碼,觀察變數refcount的變化:
<?php $foo = 1; xdebug_debug_zval('foo'); $bar = $foo; xdebug_debug_zval('foo'); $bar = 2; xdebug_debug_zval('foo'); ?> //-----執行結果----- foo: (refcount=1, is_ref=0)=1 foo: (refcount=2, is_ref=0)=1 foo: (refcount=1, is_ref=0)=1
當$foo被賦值時,$foo變數的值的只由$foo變數指向,當?$foo的值被賦給?$bar時,PHP并沒有將記憶體復制一份交給$bar,而是把$foo和$bar指向一個地址, 同時參考計數增加1,也就是新的2,隨后,我們更改了$bar的值,這時如果直接需該$bar變數指向的記憶體,則?$foo的值也會跟著改變,這不是我們想要的結果,于是,PHP內核將記憶體復制出來一份,并將其值更新為賦值的:2(這個操作也稱為變數分離操作),同時原?$foo變數指向的記憶體只有$foo指向,所以參考計數更新為:refcount=1,
下面讓我們看一個查看記憶體的例子,可以更容易看到COW在記憶體使用優化方面的明顯作用:
<?php $j = 1; var_dump(memory_get_usage()); $tipi = array_fill(0, 100000, 'php-internal'); var_dump(memory_get_usage()); $tipi_copy = $tipi; var_dump(memory_get_usage()); foreach($tipi_copy as $i){ $j += count($i); } var_dump(memory_get_usage()); //-----執行結果----- $ php t.php int(630904) int(10479840) int(10479944) int(10480040)
上面的代碼比較典型的突出了COW的作用,在陣列變數$tipi被賦值給?$tipi_copy時,記憶體的使用并沒有立刻增加一半,在回圈遍歷數?$tipi_copy時也沒有發生顯著變化,在這里$tipi_copy和?$tipi變數的資料共同指向同一塊記憶體,而沒有復制,
也就是說,即使我們不使用參考,一個變數被賦值后,只要我們不改變變數的值 ,也不會新申請記憶體用來存放資料,據此我們很容易就可以想到一些COW可以非常有效的控制記憶體使用的場景:只是使用變數進行計算而很少對其進行修改操作,如函式引數的傳遞,大陣列的復制等等等不需要改變變數值的情形,
參考計數原理
了解了php變數的內部存盤結構之后,再了解下php變數賦值相關的原理和早期垃圾回識訓制,
PHP5.2中使用的記憶體回收演算法是大名鼎鼎的Reference Counting,這個演算法中文翻譯叫做“參考計數”,其思想非常直觀和簡潔:為每個記憶體物件分配一個計數器,當一個記憶體物件建立時計數器初始化為1(因此此時總是有一個變數參考此物件),以后每有一個新變數參考此記憶體物件,則計數器加1,而每當減少一個參考此記憶體物件的變數則計數器減1,當垃圾回識訓制運作的時候,將所有計數器為0的記憶體物件銷毀并回收其占用的記憶體,
記憶體泄漏
但是php5.3版本之前的垃圾回識訓制存在一個漏洞,即當陣列或物件內部子元素參考其父元素,而此時如果發生了洗掉其父元素的情況,此變數容器并不會被洗掉,因為其子元素還在指向該變數容器,但是由于所有作用域內都沒有指向該變數容器的符號,所以無法被清除,因此會發生記憶體泄漏,直到該腳本執行結束
如果你已經安裝了Xdebug,你能通過呼叫函式 xdebug_debug_zval()顯示”refcount”和”is_ref”的值,
舉例:
由于該示例不好輸出結果,用圖表示,如圖:
舉例:
unset($a); xdebug_debug_zval('a');
如圖:
根緩沖機制
php5.3版本之后引入根緩沖機制,即php啟動時默認設定指定zval數量的根緩沖區(默認是10000),當php發現有存在回圈參考的zval時,就會把其投入到根緩沖區,當根緩沖區達到組態檔中的指定數量(默認是10000)后,就會進行垃圾回收,以此解決回圈參考導致的記憶體泄漏問題
為什么記憶體沒有全部識訓來
因為php的核心結構Hashtable,在定義的時候不可能一次性分配足夠多的記憶體塊,所以初始化的時候只會分配一小塊,等不夠的時候在進行擴容,而Hashtable只擴容不減少,所以當存入100個變數的時候符號表不夠用了就進行一次擴容,當unset()時只是放了為變數值分配的記憶體,但是為變數名分配的記憶體還是在符號表中的,符號表并沒有縮小,所以沒識訓來的記憶體是被符號表占去了,
php并不是只要記憶體不夠就去向OS申請記憶體,而是先申請一大塊記憶體,然后將其中一部分分給申請者,這樣再有邏輯需要申請記憶體的時候,就不需要再向OS申請記憶體了,避免了重復申請,只有當一大塊記憶體不夠用的時候再去申請,而當釋放記憶體時,php并非把記憶體還給了OS,而是把記憶體軌道自己維護的空閑記憶體串列,以便重復利用,
垃圾回收相關的配置
- zend.enable_gc,默認值為on,如果想關閉垃圾回識訓制,可以設定為off
小知識點
- unset():unset()只是斷開一個變數到一塊記憶體區域的連接,同時將該記憶體區域的參考計數減1,記憶體是否回收主要還是看refcount是否到0了,
- null:將null賦值給一個變數是直接將該變數指向的資料結構置空,同時將其參考計數歸0,
- 腳本執行結束:該腳本中所有記憶體都會被釋放,無論是否有環參考,
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/136632.html
標籤:PHP
上一篇:PHP常用的自定義函式
下一篇:初識面向物件
