PHP 中的变量类型和值是通过 C 语言实现的,内核具体是如何组织用户在 PHP 中定义的变量呢?
Hash Table 在 ZE 内核中被广泛使用,PHP 变量也正是存储在一个 HashTable 实现的符号表里。当在 PHP 中调用一个函数或者类时,内核会创建一个新的符号表,这也是为什么在函数中无法使用函数外部定义的变量的原因。因为他们分属两个符号表,一个当前作用域,一个全局作用域。
现在来看内核中是如何定义作用域的:
- struct _zend_executor_globals {
- //略
- HashTable symbol_table; //全局变量的符号表
- HashTable * active_symbol_table; //局部变量的符号表
- //略
- };
可以通过 EG 宏来访问变量符号表,EG(symbol_table) 访问全局作用域的变量符号表,EG(active_symbol_table) 访问当前作用域的变量符号表。
- <?php
- $foo='bar';
- ?>
上面这段代码很简单,创建变量 foo,并赋值 bar。之后的 PHP 代码中就可以调用 $foo 变量了。现在看看 PHP 中定义的变量,内核中是如何实现的。伪代码:
- zval * foo;
- MAKE_STD_ZVAL(foo);
- ZVAL_STRING(foo, "bar", 1);
- ZEND_SET_SYMBOL(EG(active_symbol_table), "foo", foo);
通过简单的这三步,即可实现定义 PHP 变量。简单的原因,在于内核为我们提供了强大的宏。现在我们将宏分别展开。
MAKE_STD_ZVAL 应用到的宏有:
- #define MAKE_STD_ZVAL(zv) ALLOC_ZVAL(zv);INIT_PZVAL(zv)
- #define ALLOC_ZVAL(z) ZEND_FAST_ALLOC(z, zval, ZVAL_CACHE_LIST)
- #define ZEND_FAST_ALLOC(p, type, fc_type) (p) = (type *) emalloc(sizeof(type))
- #define INIT_PZVAL(z) (z)->refcount__gc = 1;(z)->is_ref__gc = 0;
MAKE_STD_ZVAL(foo) 展开后得到:
- (foo) = (zval *) emalloc(sizeof(zval));
- (foo)->refcount__gc = 1;
- (foo)->is_ref__gc = 0;
可以看出,MAKE_STD_ZVAL 做了三件事:分配内存、初始化 zval 结构中的 refcount、is_ref。
ZVAL_STRING 应用到的宏有:
- #define ZVAL_STRING(z, s, duplicate) {
- const char *__s=(s);
- Z_STRLEN_P(z) = strlen(__s);
- Z_STRVAL_P(z) = (duplicate?estrndup(__s, Z_STRLEN_P(z)):(char*)__s);
- Z_TYPE_P(z) = IS_STRING;
- }
- #define Z_STRLEN_P(zval_p) Z_STRLEN(*zval_p)
- #define Z_STRLEN(zval) (zval).value.str.len
- #define Z_STRVAL_P(zval_p) Z_STRVAL(*zval_p)
- #define Z_STRVAL(zval) (zval).value.str.val
- #define Z_TYPE_P(zval_p) Z_TYPE(*zval_p)
- #define Z_TYPE(zval) (zval).type
- #define IS_STRING 6
展开后得到:
- const char *__s=("foo");
- (foo).value.str.len=strlen(__s);
- (foo).value.str.val=(duplicate?estrndup(__s, (zval).value.str.len):(char*)__s);
- (foo).type=6;
ZVAL_STRING 做的工作是设置数据类型并赋值。
ZEND_SET_SYMBOL 这里只展开一部分宏,因为它展开后过于复杂。
- #define EG(v)(executor_globals.v)
展开部分后得到:
- ZEND_SET_SYMBOL(executor_globals.active_symbol_table, "foo", foo);
将变量名入当前作用域符号表。之所以使用内核提供的宏来分配内存、注册变量作用域,是因为这样能提高兼容性。
来源: http://it.taocms.org/08/4487.htm