- 簡(jiǎn)體
- 簡(jiǎn)體中文 English
[北京網(wǎng)站制作]PHP內(nèi)核介紹及擴(kuò)展開發(fā)指南—基礎(chǔ)知識(shí)
PHP內(nèi)核介紹及擴(kuò)展開發(fā)指南—基礎(chǔ)知識(shí)
一、 基礎(chǔ)知識(shí)
本章簡(jiǎn)要介紹一些Zend引擎的內(nèi)部機(jī)制,這些知識(shí)和Extensions密切相關(guān),同時(shí)也可以幫助我們寫出更加高效的PHP代碼。
1.1 PHP變量的存儲(chǔ)
1.1.1 zval結(jié)構(gòu)
Zend使用zval結(jié)構(gòu)來存儲(chǔ)PHP變量的值,該結(jié)構(gòu)如下所示:
- typedef union _zvalue_value {
- long lval; /* long value */
- double dval; /* double value */
- struct {
- char *val;
- int len;
- } str;
- HashTable *ht; /* hash table value */
- zend_object_value obj;
- } zvalue_value;
- struct _zval_struct {
- /* Variable information */
- zvalue_value value; /* value */
- zend_uint refcount;
- zend_uchar type; /* active type */
- zend_uchar is_ref;
- };
- typedef struct _zval_struct zval;
- <span id="more-597"></span>Zend根據(jù)type值來決定訪問value的哪個(gè)成員,可用值如下:
IS_NULLN/A
IS_LONG對(duì)應(yīng)value.lval
IS_DOUBLE對(duì)應(yīng)value.dval
IS_STRING對(duì)應(yīng)value.str
IS_ARRAY對(duì)應(yīng)value.ht
IS_OBJECT對(duì)應(yīng)value.obj
IS_BOOL對(duì)應(yīng)value.lval.
IS_RESOURCE對(duì)應(yīng)value.lval
根據(jù)這個(gè)表格可以發(fā)現(xiàn)兩個(gè)有意思的地方:首先是PHP的數(shù)組其實(shí)就是一個(gè)HashTable,這就解釋了為什么PHP能夠支持關(guān)聯(lián)數(shù)組了;其次,Resource就是一個(gè)long值,它里面存放的通常是個(gè)指針、一個(gè)內(nèi)部數(shù)組的index或者其它什么只有創(chuàng)建者自己才知道的東西,可以將其視作一個(gè)handle
1.1.1 引用計(jì)數(shù)
引用計(jì)數(shù)在垃圾收集、內(nèi)存池以及字符串等地方應(yīng)用廣泛,Zend就實(shí)現(xiàn)了典型的引用計(jì)數(shù)。多個(gè)PHP變量可以通過引用計(jì)數(shù)機(jī)制來共享同一份zval,zval中剩余的兩個(gè)成員is_ref和refcount就用來支持這種共享。
很明顯,refcount用于計(jì)數(shù),當(dāng)增減引用時(shí),這個(gè)值也相應(yīng)的遞增和遞減,一旦減到零,Zend就會(huì)回收該zval。
那么is_ref呢?
1.1.2 zval狀態(tài)
在PHP中,變量有兩種——引用和非引用的,它們?cè)赯end中都是采用引用計(jì)數(shù)的方式存儲(chǔ)的。對(duì)于非引用型變量,要求變量間互不相干,修改一個(gè)變量時(shí),不能影響到其他變量,采用Copy-On-Write機(jī)制即可解決這種沖突——當(dāng)試圖寫入一個(gè)變量時(shí),Zend若發(fā)現(xiàn)該變量指向的zval被多個(gè)變量共享,則為其復(fù)制一份refcount為1的zval,并遞減原zval的refcount,這個(gè)過程稱為“zval分離”。然而,對(duì)于引用型變量,其要求和非引用型相反,引用賦值的變量間必須是捆綁的,修改一個(gè)變量就修改了所有捆綁變量。
可見,有必要指出當(dāng)前zval的狀態(tài),以分別應(yīng)對(duì)這兩種情況,is_ref就是這個(gè)目的,它指出了當(dāng)前所有指向該zval的變量是否是采用引用賦值的——要么全是引用,要么全不是。此時(shí)再修改一個(gè)變量,只有當(dāng)發(fā)現(xiàn)其zval的is_ref為0,即非引用時(shí),Zend才會(huì)執(zhí)行Copy-On-Write。
1.1.3 zval狀態(tài)切換
當(dāng)在一個(gè)zval上進(jìn)行的所有賦值操作都是引用或者都是非引用時(shí),一個(gè)is_ref就足夠應(yīng)付了。然而,世界總不會(huì)那么美好,PHP無法對(duì)用戶進(jìn)行這種限制,當(dāng)我們混合使用引用和非引用賦值時(shí),就必須要進(jìn)行特別處理了。
情況I、看如下PHP代碼:
- <!--p $a = 1; $b = &$a; $c = &$b; $d = $c; // 在一堆引用賦值中,插入一個(gè)非引用-->
全過程如下所示:
這段代碼的前三句將把a(bǔ)、b和c指向一個(gè)zval,其is_ref=1, refcount=3;第四句是個(gè)非引用賦值,通常情況下只需要增加引用計(jì)數(shù)即可,然而目標(biāo)zval屬于引用變量,單純的增加引用計(jì)數(shù)顯然是錯(cuò)誤的, Zend的解決辦法是為d單獨(dú)生成一份zval副本。
1.1.1 參數(shù)傳遞
PHP函數(shù)參數(shù)的傳遞和變量賦值是一樣的,非引用傳遞相當(dāng)于非引用賦值,引用傳遞相當(dāng)于引用賦值,并且也有可能會(huì)導(dǎo)致執(zhí)行zval狀態(tài)切換。這在后面還將提到。
1.2 HashTable結(jié)構(gòu)
HashTable是Zend引擎中最重要、使用最廣泛的數(shù)據(jù)結(jié)構(gòu),它被用來存儲(chǔ)幾乎所有的東西。
1.1.1 數(shù)據(jù)結(jié)構(gòu)
HashTable數(shù)據(jù)結(jié)構(gòu)定義如下:
- typedef struct bucket {
- ulong h; // 存放hash
- uint nKeyLength;
- void *pData; // 指向value,是用戶數(shù)據(jù)的副本
- void *pDataPtr;
- struct bucket *pListNext; // pListNext和pListLast組成
- struct bucket *pListLast; // 整個(gè)HashTable的雙鏈表
- struct bucket *pNext; // pNext和pLast用于組成某個(gè)hash對(duì)應(yīng)
- struct bucket *pLast; // 的雙鏈表
- char arKey[1]; // key
- } Bucket;
- typedef struct _hashtable {
- uint nTableSize;
- uint nTableMask;
- uint nNumOfElements;
- ulong nNextFreeElement;
- Bucket *pInternalPointer; /* Used for element traversal */
- Bucket *pListHead;
- Bucket *pListTail;
- Bucket **arBuckets; // hash數(shù)組
- dtor_func_t pDestructor; // HashTable初始化時(shí)指定,銷毀Bucket時(shí)調(diào)用
- zend_bool persistent; // 是否采用C的內(nèi)存分配例程
- unsigned char nApplyCount;
- zend_bool bApplyProtection;
- #if ZEND_DEBUG
- int inconsistent;
- #endif
- } HashTable;
總的來說,Zend的HashTable是一種鏈表散列,同時(shí)也為線性遍歷進(jìn)行了優(yōu)化。
HashTable中包含兩種數(shù)據(jù)結(jié)構(gòu),一個(gè)鏈表散列和一個(gè)雙向鏈表,前者用于進(jìn)行快速鍵-值查詢,后者方便線性遍歷和排序,一個(gè)Bucket同時(shí)存在于這兩個(gè)數(shù)據(jù)結(jié)構(gòu)中。
關(guān)于該數(shù)據(jù)結(jié)構(gòu)的幾點(diǎn)解釋:
l 鏈表散列中為什么使用雙向鏈表?
一般的鏈表散列只需要按key進(jìn)行操作,只需要單鏈表就夠了。但是,Zend有時(shí)需要從鏈表散列中刪除給定的Bucket,使用雙鏈表可以非常高效的實(shí)現(xiàn)。
l nTableMask是干什么的?
這個(gè)值用于hash值到arBuckets數(shù)組下標(biāo)的轉(zhuǎn)換。當(dāng)初始化一個(gè)HashTable,Zend首先為arBuckets數(shù)組分配nTableSize大小的內(nèi)存,nTableSize取不小于用戶指定大小的最小的2^n,即二進(jìn)制的10*。nTableMask = nTableSize – 1,即二進(jìn)制的01*,此時(shí)h & nTableMask就恰好落在 [0, nTableSize – 1] 里,Zend就以其為index來訪問arBuckets數(shù)組。
l pDataPtr是干什么的?
通常情況下,當(dāng)用戶插入一個(gè)鍵值對(duì)時(shí),Zend會(huì)將value復(fù)制一份,并將pData指向value副本。復(fù)制操作需要調(diào)用Zend內(nèi)部例程 emalloc來分配內(nèi)存,這是個(gè)非常耗時(shí)的操作,并且會(huì)消耗比value大的一塊內(nèi)存(多出的內(nèi)存用于存放cookie),如果value很小的話,將會(huì)造成較大的浪費(fèi)。考慮到HashTable多用于存放指針值,于是Zend引入pDataPtr,當(dāng)value小到和指針一樣長(zhǎng)時(shí),Zend就直接將其復(fù)制到pDataPtr里,并且將pData指向pDataPtr。這就避免了emalloc操作,同時(shí)也有利于提高Cache命中率。
arKey大小為什么只有1?為什么不使用指針管理key?
arKey是存放key的數(shù)組,但其大小卻只有1,并不足以放下key。在HashTable的初始化函數(shù)里可以找到如下代碼:
1p = (Bucket *) pemalloc(sizeof(Bucket) - 1 + nKeyLength, ht->persistent);
可見,Zend為一個(gè)Bucket分配了一塊足夠放下自己和key的內(nèi)存,
l 上半部分是Bucket,下半部分是key,而arKey“恰好”是Bucket的最后一個(gè)元素,于是就可以使用arKey來訪問key了。這種手法在內(nèi)存管理例程中最為常見,當(dāng)分配內(nèi)存時(shí),實(shí)際上是分配了比指定大小要大的內(nèi)存,多出的上半部分通常被稱為cookie,它存儲(chǔ)了這塊內(nèi)存的信息,比如塊大小、上一塊指針、下一塊指針等,baidu的Transmit程序就使用了這種方法。
不用指針管理key,是為了減少一次emalloc操作,同時(shí)也可以提高Cache命中率。另一個(gè)必需的理由是,key絕大部分情況下是固定不變的,不會(huì)因?yàn)閗ey變長(zhǎng)了而導(dǎo)致重新分配整個(gè)Bucket。這同時(shí)也解釋了為什么不把value也一起作為數(shù)組分配了——因?yàn)関alue是可變的。
1.2.2 PHP數(shù)組
關(guān)于HashTable還有一個(gè)疑問沒有回答,就是nNextFreeElement是干什么的?
不同于一般的散列,Zend的HashTable允許用戶直接指定hash值,而忽略key,甚至可以不指定key(此時(shí),nKeyLength為0)。同時(shí),HashTable也支持append操作,用戶連hash值也不用指定,只需要提供value,此時(shí),Zend就用nNextFreeElement作為hash,之后將nNextFreeElement遞增。
HashTable的這種行為看起來很奇怪,因?yàn)檫@將無法按key訪問value,已經(jīng)完全不是個(gè)散列了。理解問題的關(guān)鍵在于,PHP數(shù)組就是使用HashTable實(shí)現(xiàn)的——關(guān)聯(lián)數(shù)組使用正常的k-v映射將元素加入HashTable,其key為用戶指定的字符串;非關(guān)聯(lián)數(shù)組則直接使用數(shù)組下標(biāo)作為hash值,不存在key;而當(dāng)在一個(gè)數(shù)組中混合使用關(guān)聯(lián)和非關(guān)聯(lián)時(shí),或者使用array_push操作時(shí),就需要用nNextFreeElement了。
再來看value,PHP數(shù)組的value直接使用了zval這個(gè)通用結(jié)構(gòu),pData指向的是zval*,按照上一節(jié)的介紹,這個(gè)zval*將直接存儲(chǔ)在pDataPtr里。由于直接使用了zval,數(shù)組的元素可以是任意PHP類型。
數(shù)組的遍歷操作,即foreach、each等,是通過HashTable的雙向鏈表來進(jìn)行的,pInternalPointer作為游標(biāo)記錄了當(dāng)前位置。
1.2.3 變量符號(hào)表
除了數(shù)組,HashTable還被用來存儲(chǔ)許多其他數(shù)據(jù),比如,PHP函數(shù)、變量符號(hào)、加載的模塊、類成員等。
一個(gè)變量符號(hào)表就相當(dāng)于一個(gè)關(guān)聯(lián)數(shù)組,其key是變量名(可見,使用很長(zhǎng)的變量名并不是個(gè)好主意),value是zval*。
在任一時(shí)刻PHP代碼都可以看見兩個(gè)變量符號(hào)表——symbol_table和active_symbol_table——前者用于存儲(chǔ)全局變量,稱為全局符號(hào)表;后者是個(gè)指針,指向當(dāng)前活動(dòng)的變量符號(hào)表,通常情況下就是全局符號(hào)表。但是,當(dāng)每次進(jìn)入一個(gè)PHP函數(shù)時(shí)(此處指的是用戶使用PHP代碼創(chuàng)建的函數(shù)),Zend都會(huì)創(chuàng)建函數(shù)局部的變量符號(hào)表,并將active_symbol_table指向局部符號(hào)表。Zend總是使用active_symbol_table來訪問變量,這樣就實(shí)現(xiàn)了局部變量的作用域控制。
但如果在函數(shù)局部訪問標(biāo)記為global的變量,Zend會(huì)進(jìn)行特殊處理——在active_symbol_table中創(chuàng)建symbol_table中同名變量的引用,如果symbol_table中沒有同名變量則會(huì)先創(chuàng)建。
1.3 內(nèi)存和文件
程序擁有的資源一般包括內(nèi)存和文件,對(duì)于通常的程序,這些資源是面向進(jìn)程的,當(dāng)進(jìn)程結(jié)束后,操作系統(tǒng)或C庫會(huì)自動(dòng)回收那些我們沒有顯式釋放的資源。
但是,PHP程序有其特殊性,它是基于頁面的,一個(gè)頁面運(yùn)行時(shí)同樣也會(huì)申請(qǐng)內(nèi)存或文件這樣的資源,然而當(dāng)頁面運(yùn)行結(jié)束后,操作系統(tǒng)或C庫也許不會(huì)知道需要進(jìn)行資源回收。比如,我們將php作為模塊編譯到apache里,并且以prefork或worker模式運(yùn)行apache。這種情況下apache進(jìn)程或線程是復(fù)用的,php頁面分配的內(nèi)存將永駐內(nèi)存直到出core。
為了解決這種問題,Zend提供了一套內(nèi)存分配API,它們的作用和C中相應(yīng)函數(shù)一樣,不同的是這些函數(shù)從Zend自己的內(nèi)存池中分配內(nèi)存,并且它們可以實(shí)現(xiàn)基于頁面的自動(dòng)回收。在我們的模塊中,為頁面分配的內(nèi)存應(yīng)該使用這些API,而不是C例程,否則Zend會(huì)在頁面結(jié)束時(shí)嘗試efree掉我們的內(nèi)存,其結(jié)果通常就是crush。
emalloc()
efree()
estrdup()
estrndup()
ecalloc()
erealloc()
另外,Zend還提供了一組形如VCWD_xxx的宏用于替代C庫和操作系統(tǒng)相應(yīng)的文件API,這些宏能夠支持PHP的虛擬工作目錄,在模塊代碼中應(yīng)該總是使用它們。宏的具體定義參見PHP源代碼”TSRM/tsrm_virtual_cwd.h”??赡苣銜?huì)注意到,所有那些宏中并沒有提供close操作,這是因?yàn)閏lose的對(duì)象是已打開的資源,不涉及到文件路徑,因此可以直接使用C或操作系統(tǒng)例程;同理,read/write之類的操作也是直接使用C或操作系統(tǒng)的例程。
標(biāo)簽:北京網(wǎng)站制作 高端網(wǎng)站建設(shè)
建站流程
-
網(wǎng)站需求
-
網(wǎng)站策劃方案
-
頁面設(shè)計(jì)風(fēng)格
-
確認(rèn)交付使用
-
資料錄入優(yōu)化
-
程序設(shè)計(jì)開發(fā)
-
后續(xù)跟蹤服務(wù)
-
聯(lián)系電話
010-60259772
熱門標(biāo)簽
- 網(wǎng)站建設(shè)
- 食品網(wǎng)站建設(shè)
- 微信小程序開發(fā)
- 小程序開發(fā)
- 無錫網(wǎng)站建設(shè)
- 研究所網(wǎng)站建設(shè)
- 沈陽網(wǎng)站建設(shè)
- 廊坊網(wǎng)站建設(shè)
- 鄭州網(wǎng)站建設(shè)
- 婚紗攝影網(wǎng)站建設(shè)
- 手機(jī)端網(wǎng)站建設(shè)
- 高校網(wǎng)站制作
- 天津網(wǎng)站建設(shè)
- 教育網(wǎng)站建設(shè)
- 品牌網(wǎng)站建設(shè)
- 政府網(wǎng)站建設(shè)
- 北京網(wǎng)站建設(shè)
- 網(wǎng)站設(shè)計(jì)
- 網(wǎng)站制作
最新文章
推薦新聞
更多行業(yè)-
大家都知道好的域名對(duì)網(wǎng)站優(yōu)化的作用
大家都知道好的域名對(duì)SEO網(wǎng)站優(yōu)化有一個(gè)積極的作用,我們?cè)撛鯓訉?duì)網(wǎng)站結(jié)...
2012-10-08 -
網(wǎng)站經(jīng)營(yíng)成功的三個(gè)要點(diǎn)
北京網(wǎng)站建設(shè)公司尚品中國(guó):如今站長(zhǎng)已經(jīng)是一個(gè)比較普遍的職業(yè),無論是兼職...
2012-03-06 -
為您介紹一下網(wǎng)站建設(shè)基本步驟和方法
互聯(lián)網(wǎng)的不斷普及,越來越多的企業(yè)開始注重自身的在線形象,而網(wǎng)站建設(shè)便成...
2023-05-15 -
介紹幾種經(jīng)典網(wǎng)站設(shè)計(jì)元素
用戶的閱讀習(xí)慣是隨著科技的發(fā)展而不斷變化的,北京網(wǎng)站設(shè)計(jì)也在隨著這些細(xì)...
2022-04-29 -
外貿(mào)建站需要注意的問題有哪些方面?
國(guó)內(nèi)國(guó)外新冠疫情嚴(yán)重狀況下,很多會(huì)展沒有辦法線下推廣開展,外貿(mào)建站熱度...
2022-05-06 -
企業(yè)建站如何通過網(wǎng)站展示企業(yè)實(shí)力?
企業(yè)網(wǎng)站的關(guān)鍵功能之一就是提升形象,體現(xiàn)實(shí)力。企業(yè)的實(shí)力是增加客戶好感...
2022-07-11
預(yù)約專業(yè)咨詢顧問溝通!
免責(zé)聲明
非常感謝您訪問我們的網(wǎng)站。在您使用本網(wǎng)站之前,請(qǐng)您仔細(xì)閱讀本聲明的所有條款。
1、本站部分內(nèi)容來源自網(wǎng)絡(luò),涉及到的部分文章和圖片版權(quán)屬于原作者,本站轉(zhuǎn)載僅供大家學(xué)習(xí)和交流,切勿用于任何商業(yè)活動(dòng)。
2、本站不承擔(dān)用戶因使用這些資源對(duì)自己和他人造成任何形式的損失或傷害。
3、本聲明未涉及的問題參見國(guó)家有關(guān)法律法規(guī),當(dāng)本聲明與國(guó)家法律法規(guī)沖突時(shí),以國(guó)家法律法規(guī)為準(zhǔn)。
4、如果侵害了您的合法權(quán)益,請(qǐng)您及時(shí)與我們,我們會(huì)在第一時(shí)間刪除相關(guān)內(nèi)容!
聯(lián)系方式:010-60259772
電子郵件:394588593@qq.com