PHP虛擬機是專用執行PHP代碼的,PHP代碼如何能轉換為PHP虛擬機可以識別的指令呢——編譯;PHP虛擬機同時提供了編譯器,可以將PHP代碼轉換為其可以識別的指令集合;
阿里西西web開發網為大家整理了這篇讓您徹底了解PHP虛擬機的一篇詳解文章,如果這篇文章在您的作業或學習中有幫助,歡迎常回來看看哦,更多精彩的教程請訪問我們的主頁,以下是教程瀏覽:
1.從物理機說起
虛擬機也是計算機,設計思想和物理機有很多相似之處;
1.1馮諾依曼體系結構
馮·諾依曼是當之無愧的數字計算機之父,當前計算機都采用的是馮諾依曼體系結構;設計思想主要包含以下幾個方面:
指令和資料不加區別混合存盤在同一個存盤器中,它們都是記憶體中的資料,現代CPU的保護模式,每個記憶體段都有段描述符,這個描述符記錄著這個記憶體段的訪問權限(可讀,可寫,可執行),這就變相的指定了哪些記憶體中存盤的是指令哪些是資料);https://www.hfxskyyj.com/
存盤器是按地址訪問的線性編址的一維結構,每個單元的位數是固定的;
資料以二進制表示;
指令由操作碼和操作陣列成,操作碼指明本指令的操作型別,運算元指明運算元本身或者運算元的地址,運算元本身并無資料型別,它的資料型別由操作碼確定;任何架構的計算機都會對外提供指令集合;
運算器通過執行指令直接發出控制信號控制計算機各項操作,由指令計數器指明待執行指令所在的記憶體地址,指令計數器只有一個,一般按順序遞增,但執行順序可能因為運算結果或當時的外界條件而改變;
2631839729-5b6a6ac8d5766_articlex.png
1.2匯編語言簡介
任何架構的計算機都會提供一組指令集合;
指令由操作碼和操作陣列成;操作碼即操作型別,運算元可以是一個立即數或者一個存盤地址;每條指令可以有0、1或2個運算元;
指令就是一串二進制;匯編語言是二進制指令的文本形式;
push%ebx
mov%eax,[%esp+8]
mov%ebx,[%esp+12]
add%eax,%ebx
pop%ebx
push、mov、add、pop等就是操作碼;
%ebx暫存器;[%esp+12]記憶體地址;
運算元只是一塊可存取資料的存盤區;運算元本身并無資料型別,它的資料型別由操作碼確定;
如movb傳送位元組,movw傳送字,movl傳送雙字等
1.3函式呼叫堆疊
程序(函式)是對代碼的封裝,對外暴露的只是一組指定的引數和一個可選的回傳值;可以在程式中不同的地方呼叫這個函式;假設程序P呼叫程序Q,Q執行后回傳程序P;為了實作這一功能,需要考慮三點:
指令跳轉:進入程序Q的時候,程式計數器必須被設定為Q的代碼的起始地址;在回傳時,程式計數器需要設定為P中呼叫Q后面那條指令的地址;
資料傳遞:P能夠向Q提供一個或多個引數,Q能夠向P回傳一個值;
記憶體分配與釋放:Q開始執行時,可能需要為區域變數分配記憶體空間,而在回傳前,又需要釋放這些記憶體空間;
大多數的語言程序呼叫都采用了堆疊資料結構提供的記憶體管理機制;如下圖所示:
6391936-5b6a6e2478332_articlex.png
函式的呼叫與回傳即對應的是一系列的入堆疊與出堆疊操作;
函式在執行時,會有自己私有的堆疊幀,區域變數就是分配在函式私有堆疊幀上的;
平時遇到的堆疊溢位就是因為呼叫函式層級過深,不斷入堆疊導致的;
2.PHP虛擬機
虛擬機也是計算機,參考物理機的設計,設計虛擬機時,首先應該考慮三個要素:指令,資料存盤,函式堆疊幀;
下面從這三點詳細分析PHP虛擬機的設計思路;
2.1指
2.1.1指令型別
任何架構的計算機都需要對外提供一組指令集,其代表計算機支持的一組操作型別;
PHP虛擬機對外提供186種指令,定義在zend_vm_opcodes.h檔案中;
//加、減、乘、除等
#define ZEND_ADD 1
#define ZEND_SUB 2
#define ZEND_MUL 3
#define ZEND_p 4
#define ZEND_MOD 5
#define ZEND_SL 6
#define ZEND_SR 7
#define ZEND_CONCAT 8
#define ZEND_BW_OR 9
#define ZEND_BW_AND 10
……………………
2.1.2指令
2.1.2.1指令的表示
指令由操作碼和操作陣列成;操作碼指明本指令的操作型別,運算元指明運算元本身或者運算元的地址;
PHP虛擬機定義指令格式為:操作碼運算元1運算元2回傳值;其使用結構體_zend_op表示一條指令:
struct _zend_op{
const void*handler;//指標,指向當前指令的執行函式
znode_op op1;//運算元1
znode_op op2;//運算元2
znode_op result;//回傳值
uint32_t extended_value;//擴展
uint32_t lineno;//行號
zend_uchar opcode;//指令型別
zend_uchar op1_type;//運算元1的型別(此型別并不代表字串、陣列等資料型別;其表示此運算元是常量,臨時變數,編譯變數等)
zend_uchar op2_type;//運算元2的型別
zend_uchar result_type;//回傳值的型別
};
2.1.2.2運算元的表示
從上面可以看到,運算元使用結構體znode_op表示,定義如下:
constant、var、num等都是uint32_t型別的,這怎么表示一個運算元呢?(既不是指標不能代表地址,也無法表示所有資料型別);
其實,運算元大多情況采用的相對地址表示方式,constant等表示的是相對于執行堆疊幀首地址的偏移量;
另外,_znode_op結構體中有個zval*zv欄位,其也可以表示一個運算元,這個欄位是一個指標,指向的是zval結構體,PHP虛擬機支持的所有資料型別都使用zval結構體表示;
typedef union _znode_op{
uint32_t constant;
uint32_t var;
uint32_t num;
uint32_t opline_num;
#if ZEND_USE_ABS_JMP_ADDR
zend_op*jmp_addr;
#else
uint32_t jmp_offset;
#endif
#if ZEND_USE_ABS_CONST_ADDR
zval*zv;
#endif
}znode_op;
2.2資料存盤
PHP虛擬機支持多種資料型別:整型、浮點型、字串、陣列,物件等;PHP虛擬機如何存盤和表示多種資料型別?
2.1.2.2節指出結構體_znode_op代表一個運算元;運算元可以是一個偏移量(計算得到一個地址,即zval結構體的首地址),或者一個zval指標;PHP虛擬機使用zval結構體表示和存盤多種資料;
struct _zval_struct{
zend_value value;//存盤實際的value值
union{
struct{//一些標志位
ZEND_ENDIAN_LOHI_4(
zend_uchar type,//重要;表示變數型別
zend_uchar type_flags,
zend_uchar const_flags,
zend_uchar reserved)/*call info for EX(This)*/
}v;
uint32_t type_info;
}u1;
union{//其他有用資訊
uint32_t next;/*hash collision chain*/
uint32_t cache_slot;/*literal cache slot*/
uint32_t lineno;/*line number(for ast nodes)*/
uint32_t num_args;/*arguments number for EX(This)*/
uint32_t fe_pos;/*foreach position*/
uint32_t fe_iter_idx;/*foreach iterator index*/
uint32_t access_flags;/*class constant access flags*/
uint32_t property_guard;/*single property guard*/
}u2;
};
zval.u1.type表示資料型別,zend_types.h檔案定義了以下型別:
#define IS_UNDEF 0
#define IS_NULL 1
#define IS_FALSE 2
#define IS_TRUE 3
#define IS_LONG 4
#define IS_DOUBLE 5
#define IS_STRING 6
#define IS_ARRAY 7
#define IS_OBJECT 8
#define IS_RESOURCE 9
#define IS_REFERENCE 10
…………
zend_value存盤具體的資料內容,結構體定義如下:
_zend_value占16位元組記憶體;long、double型別會直接存盤在結構體;參考、字串、陣列等型別使用指標存盤;
代碼中根據zval.u1.type欄位,判斷資料型別,以此決定操作_zend_value結構體哪個欄位;
可以看出,字串使用zend_string表示,陣列使用zend_array表示…
typedef union _zend_value{
zend_long lval;
double dval;
zend_refcounted*counted;
zend_string*str;
zend_array*arr;
zend_object*obj;
zend_resource*res;
zend_reference*ref;
zend_ast_ref*ast;
zval*zv;
void*ptr;
zend_class_entry*ce;
zend_function*func;
struct{
uint32_t w1;
uint32_t w2;
}ww;
}zend_value;
如下圖為PHP7中字串結構圖:
2081089099-5b6a6ef88f01a_articlex.png
2.3再談指令
2.1.2.1指出,指令使用結構體_zend_op表示;其中最主要2個屬性:操作函式,運算元(兩個運算元和一個回傳值);
運算元的型別(常量、臨時變數等)不同,同一個指令對應的handler函式也會不同;運算元型別定義在Zend/zend_compile.h檔案:
//常量
#define IS_CONST(1<<0)
//臨時變數,用于操作的中間結果;不能被其他指令對應的handler重復使用
#define IS_TMP_VAR(1<<1)
//這個變數并不是PHP代碼中宣告的變數,常見的是回傳的臨時變數,比如$a=time(),函式time回傳值的型別就是IS_VAR,這種型別的變數是可以被其他指令對應的handler重復使用的
#define IS_VAR(1<<2)
#define IS_UNUSED(1<<3)/*Unused variable*/
//編譯變數;即PHP中宣告的變數;
#define IS_CV(1<<4)/*Compiled variable*/
操作函式命名規則為:ZEND_[opcode]_SPEC_(運算元1型別)_(運算元2型別)_(回傳值型別)_HANDLER
比如賦值陳述句就有以下多種操作函式:
ZEND_ASSIGN_SPEC_VAR_CONST_RETVAL_UNUSED_HANDLER,
ZEND_ASSIGN_SPEC_VAR_TMP_RETVAL_UNUSED_HANDLER,
ZEND_ASSIGN_SPEC_VAR_VAR_RETVAL_UNUSED_HANDLER,
ZEND_ASSIGN_SPEC_VAR_CV_RETVAL_UNUSED_HANDLER,
…
對于$a=1,其操作函式為:ZEND_ASSIGN_SPEC_CV_CONST_RETVAL_UNUSED_HANDLER;函式實作為:
static ZEND_OPCODE_HANDLER_RET ZEND_FASTCALL ZEND_ASSIGN_SPEC_CV_CONST_RETVAL_UNUSED_HANDLER(ZEND_OPCODE_HANDLER_ARGS)
{
USE_OPLINE
zval*value;
zval*variable_ptr;
SAVE_OPLINE();
//獲取op2對應的值,也就是1
value=https://www.cnblogs.com/zqw111/p/EX_CONSTANT(opline->op2);
//在execute_data中獲取op1的位置,也就是$a(execute_data類似函式堆疊幀,后面詳細分析)
variable_ptr=_get_zval_ptr_cv_undef_BP_VAR_W(execute_data,opline->op1.var);
//賦值
value=https://www.cnblogs.com/zqw111/p/zend_assign_to_variable(variable_ptr,value,IS_CONST);
if(UNEXPECTED(0)){
ZVAL_COPY(EX_VAR(opline->result.var),value);
}
ZEND_VM_NEXT_OPCODE_CHECK_EXCEPTION();
}
2.4函式堆疊幀
2.4.1指令集
上面分析了指令的結構與表示,PHP虛擬機使用_zend_op_array表示指令的集合:
struct _zend_op_array{
…………
//last表示指令總數;opcodes為存盤指令的陣列;
uint32_t last;
zend_op*opcodes;
//變數型別為IS_CV的個數
int last_var;
//變數型別為IS_VAR和IS_TEMP_VAR的個數
uint32_t T;
//存放IS_CV型別變數的陣列
zend_string**vars;
…………
//靜態變數
HashTable*static_variables;
//常量個數;常量陣列
int last_literal;
zval*literals;
…
};
注意:last_var代表IS_CV型別變數的個數,這種型別變數存放在vars陣列中;在整個編譯程序中,每次遇到一個IS_CV型別的變數(類似于$something),就會去遍歷vars陣列,檢查是否已經存在,如果不存在,則插入到vars中,并將last_var的值設定為該變數的運算元;如果存在,則使用之前分配的運算元
2.4.2函式堆疊幀
PHP虛擬機實作了與1.3節物理機類似的函式堆疊幀結構;
使用_zend_vm_stack表示堆疊結構;多個堆疊之間使用prev欄位形成單向鏈表;top和end指向堆疊低和堆疊頂,分別為zval型別的指標;
struct _zend_vm_stack{
zval*top;
zval*end;
zend_vm_stack prev;
};
考慮如何設計函式執行時候的幀結構:當前函式執行時,需要存盤函式編譯后的指令,需要存盤函式內部的區域變數等(2.1.2.2節指出,運算元使用結構體znode_op表示,其內部使用uint32_t表示運算元,此時表示的就是當前zval變數相對于當前函式堆疊幀首地址的偏移量);
PHP虛擬機使用結構體_zend_execute_data存盤當前函式執行所需資料;
struct _zend_execute_data{
//當前指令指令
const zend_op*opline;
//當前函式執行堆疊幀
zend_execute_data*call;
//函式回傳資料
zval*return_value;
zend_function*func;
zval This;/*this+call_info+num_args*/
//呼叫當前函式的堆疊幀
zend_execute_data*prev_execute_data;
//符號表
zend_array*symbol_table;
#if ZEND_EX_USE_RUN_TIME_CACHE
void**run_time_cache;
#endif
#if ZEND_EX_USE_LITERALS
//常量陣列
zval*literals;
#endif
};
函式開始執行時,需要為函式分配相應的函式堆疊幀并入堆疊,代碼如下:
static zend_always_inline zend_execute_data*zend_vm_stack_push_call_frame(uint32_t call_info,zend_function*func,uint32_t num_args,zend_class_entry*called_scope,zend_object*object)
{
//計算當前函式堆疊幀需要記憶體空間大小
uint32_t used_stack=zend_vm_calc_used_stack(num_args,func);
//根據堆疊幀大小分配空間,入堆疊
return zend_vm_stack_push_call_frame_ex(used_stack,call_info,
func,num_args,called_scope,object);
}
//計算函式堆疊幀大小
static zend_always_inline uint32_t zend_vm_calc_used_stack(uint32_t num_args,zend_function*func)
{
//_zend_execute_data大小(80位元組/16位元組=5)+引數數目
uint32_t used_stack=ZEND_CALL_FRAME_SLOT+num_args;
if(EXPECTED(ZEND_USER_CODE(func->type))){
//當前函式臨時變數等數目
used_stack+=func->op_array.last_var+func->op_array.T-MIN(func->op_array.num_args,num_args);
}
//乘以16位元組
return used_stack*sizeof(zval);
}
//入堆疊
static zend_always_inline zend_execute_data*zend_vm_stack_push_call_frame_ex(uint32_t used_stack,uint32_t call_info,zend_function*func,uint32_t num_args,zend_class_entry*called_scope,zend_object*object)
{
//上一個函式堆疊幀地址
zend_execute_data*call=(zend_execute_data*)EG(vm_stack_top);
//移動函式呼叫堆疊top指標
EG(vm_stack_top)=(zval*)((char*)call+used_stack);
//初始化當前函式堆疊幀
zend_vm_init_call_frame(call,call_info,func,num_args,called_scope,object);
//回傳當前函式堆疊幀首地址
return call;
}
從上面分析可以得到函式堆疊幀結構圖如下所示:
1497251327-5b6a6fb3222d7_articlex.png
總結
PHP虛擬機也是計算機,有三點是我們需要重點關注的:指令集(包含指令處理函式)、資料存盤(zval)、函式堆疊幀;
此時虛擬機已可以接受指令并執行指令代碼;
但是,PHP虛擬機是專用執行PHP代碼的,PHP代碼如何能轉換為PHP虛擬機可以識別的指令呢——編譯;
PHP虛擬機同時提供了編譯器,可以將PHP代碼轉換為其可以識別的指令集合;
理論上你可以自定義任何語言,只要實作編譯器,能夠將你自己的語言轉換為PHP可以識別的指令代碼,就能被PHP虛擬機執行;
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/38659.html
標籤:PHP
下一篇:PHP基礎學習之陣列介紹
