PHP進階學習之垃圾回收機制詳解

語言: CN / TW / HK

一、概念

垃圾回收機制是一種動態存儲分配的方案。它會自動釋放程序不再需要的已分配的內存塊。垃圾回收機制可以讓程序員不必過分關心程序內存分配,從而將更多的精力投入到業務邏輯。
在現在的流行各種語言當中,垃圾回收機制是新一代語言所共有的特徵,如Python、PHP、C#、Ruby等都使用了垃圾回收機制。

二、PHP垃圾回收機制

1、在PHP5.3版本之前,使用的垃圾回收機制是單純的“引用計數”。即:
①每個內存對象都分配一個計數器,當內存對象被變量引用時,計數器+1;
②當變量引用撤掉後(執行unset()後),計數器-1;
③當計數器=0時,表明內存對象沒有被使用,該內存對象則進行銷燬,垃圾回收完成。
並且PHP在一個生命週期結束後就會釋放此進程/線程所佔的內容,這種方式決定了PHP在前期不需要過多考慮內存的泄露問題。


但是當兩個或多個對象互相引用形成環狀後,內存對象的計數器則不會消減為0;這時候,這一組內存對象已經沒用了,但是不能回收,從而導致內存泄露的現象。
php5.3開始,使用了新的垃圾回收機制,在引用計數基礎上,實現了一種複雜的算法,來檢測內存對象中引用環的存在,以避免內存泄露。


2、隨着PHP的發展,PHP開發者的增加以及其所承載的業務範圍的擴大,在PHP5.3中引入了更加完善的垃圾回收機制,新的垃圾回收機制解決了無法處理循環的引用內存泄漏問題。
如官方文檔所説:每個php變量存在一個叫"zval"的變量容器中。一個zval變量容器,除了包含變量的類型和值,還包括兩個字節的額外信息。第一個是"is_ref",是個bool值,用來標識這個變量是否是屬於引用集合(reference set)。通過這個字節,php引擎才能把普通變量和引用變量區分開來,由於php允許用户通過使用&來使用自定義引用,zval變量容器中還有一個內部引用計數機制,來優化內存使用。


第二個額外字節是"refcount",用以表示指向這個zval變量容器的變量(也稱符號即symbol)個數。所有的符號存在一個符號表中,其中每個符號都有作用域(scope)。
官方文檔所説,可以使用Xdebug來檢查引用計數情況:

<?php
$a = "new string";
$c = $b = $a;
xdebug_debug_zval( 'a' );
unset( $b, $c );
xdebug_debug_zval( 'a' );
?>

以上例程會輸出:

a: (refcount=3, is_ref=0)='new string' 
a: (refcount=1, is_ref=0)='new string'

注意:從PHP7的NTS版本開始,以上例程的引用將不再被計數,即$c=$b=$a之後a的引用計數也是1.具體分類如下:
在PHP 7中,zval可以被引用計數或不被引用。在zval結構中有一個標誌確定了這一點。
①對於null,bool,int和double的類型變量,refcount永遠不會計數;
②對於對象、資源類型,refcount計數和php5的一致;
③對於字符串,未被引用的變量被稱為“實際字符串”。而那些被引用的字符串被重複刪除(即只有一個帶有特定內容的**入的字符串)並保證在請求的整個持續時間內存在,所以不需要為它們使用引用計數;如果使用了opcache,這些字符串將存在於共享內存中,在這種情況下,您不能使用引用計數(因為我們的引用計數機制是非原子的);
④對於數組,未引用的變量被稱為“不可變數組”。其數組本身計數與php5一致,但是數組裏面的每個鍵值對的計數,則按前面三條的規則(即如果是字符串也不在計數);如果使用opcache,則代碼中的常量數組文字將被轉換為不可變數組。
再次,這些生活在共享內存,因此不能使用refcounting。
我們的demo例子如下:

<?php
echo '測試字符串引用計數';
$a = "new string";
$b = $a;
xdebug_debug_zval( 'a' );
unset( $b);
xdebug_debug_zval( 'a' );
$b = &$a;
xdebug_debug_zval( 'a' );
echo '測試數組引用計數';
$c = array('a','b');
xdebug_debug_zval( 'c' );
$d = $c;
xdebug_debug_zval( 'c' );
$c[2]='c';
xdebug_debug_zval( 'c' );
echo '測試int型計數';
$e = 1;
xdebug_debug_zval( 'e' );

看到的輸出如下:

三、回收週期
默認的,PHP的垃圾回收機制是打開的,然後有個php.ini設置允許你修改它:zend.enable_gc 。
當垃圾回收機制打開時,算法會判斷每當根緩存區存滿時,就會執行循環查找。根緩存區有固定的大小,默認10,000,可以通過修改PHP源碼文件Zend/zend_gc.c中的常量GC_ROOT_BUFFER_MAX_ENTRIES,然後重新編譯PHP,來修改這個值。當垃圾回收機制關閉時,循環查找算法永不執行,然而,根將一直存在根緩衝區中,不管在配置中垃圾回收機制是否激活。
除了修改配置zend.enable_gc ,也能通過分別調用gc_enable() 和 gc_disable()函數在運行php時來打開和關閉垃圾回收機制。調用這些函數,與修改配置項來打開或關閉垃圾回收機制的效果是一樣的。即使在可能根緩衝區還沒滿時,也能強制執行週期回收。你能調用gc_collect_cycles()函數達到這個目的。這個函數將返回使用這個算法回收的週期數。
允許打開和關閉垃圾回收機制並且允許自主的初始化的原因,是由於你的應用程序的某部分可能是高時效性的。在這種情況下,你可能不想使用垃圾回收機制。當然,對你的應用程序的某部分關閉垃圾回收機制,是在冒着可能內存泄漏的風險,因為一些可能根也許存不進有限的根緩衝區。
因此,就在你調用gc_disable()函數釋放內存之前,先調用gc_collect_cycles()函數可能比較明智。因為這將清除已存放在根緩衝區中的所有可能根,然後在垃圾回收機制被關閉時,可留下空緩衝區以有更多空間存儲可能根。


四、性能影響
1、內存佔用空間的節省
首先,實現垃圾回收機制的整個原因是為了一旦先決條件滿足,通過清理循環引用的變量來節省內存佔用。在PHP執行中,一旦根緩衝區滿了或者調用gc_collect_cycles() 函數時,就會執行垃圾回收。
2、執行時間增加
垃圾回收影響性能的第二個領域是它釋放已泄漏的內存耗費的時間。
通常,PHP中的垃圾回收機制,僅僅在循環回收算法確實運行時會有時間消耗上的增加。但是在平常的(更小的)腳本中應根本就沒有性能影響。


3、在平常腳本中有循環回收機制運行的情況下,內存的節省將允許更多這種腳本同時運行在你的服務器上。因為總共使用的內存沒達到上限。
這種好處在長時間運行腳本中尤其明顯,諸如長時間的測試套件或者daemon腳本此類。同時,對通常比Web腳本運行時間長的腳本應用程序,新的垃圾回收機制,應該會大大改變一直以來認為內存泄漏問題難以解決的看法。

以上內容希望幫助到大家,更多PHP大廠PDF面試文檔,PHP進階架構視頻資料,PHP精彩好文免費獲取可以微信搜索關注公眾號:PHP開源社區,或者訪問:

2021金三銀四大廠面試真題集錦,必看!

四年精華PHP技術文章整理合集——PHP框架篇

四年精華PHP技術文合集——微服務架構篇

四年精華PHP技術文合集——分佈式架構篇

四年精華PHP技術文合集——高併發場景篇

四年精華PHP技術文章整理合集——數據庫篇