PHP中的语言构造和“内置”函数有什么区别?

时间:2009-07-24 21:16:34

标签: php function built-in language-construct

我知道includeissetrequireprintecho以及其他一些不是函数,而是语言结构。

其中一些语言结构需要括号,其他语言结构则不需要。

require 'file.php';
isset($x);

有些人有返回值,有些则没有。

print 'foo'; //1
echo  'foo'; //no return value

那么语言构造和内置函数之间的内部区别是什么?

4 个答案:

答案 0 :(得分:128)

(这比我预想的要长;请耐心等待。)

大多数语言都由称为“语法”的东西组成:语言由几个明确定义的关键字组成,您可以使用该语法构建完整的表达式,并使用该语法构建。

例如,假设你有一个简单的四函数算术“语言”,它只需要一位数整数作为输入,完全忽略了操作的顺序(我告诉你它是一种简单的语言)。该语言可以通过语法定义:

// The | means "or" and the := represents definition
$expression := $number | $expression $operator $expression
$number := 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9
$operator := + | - | * | /

根据这三个规则,您可以构建任意数量的单位数输入算术表达式。然后,您可以为此语法编写解析器,将任何有效输入分解为其组件类型($expression$number$operator)并处理结果。例如,表达式3 + 4 * 5可以按如下方式细分:

// Parentheses used for ease of explanation; they have no true syntactical meaning
$expression = 3 + 4 * 5
            = $expression $operator (4 * 5) // Expand into $exp $op $exp
            = $number $operator $expression // Rewrite: $exp -> $num
            = $number $operator $expression $operator $expression // Expand again
            = $number $operator $number $operator $number // Rewrite again

现在我们在我们定义的语言中为原始表达式提供了完全解析的语法。完成后,我们可以通过编写解析器来查找$number $operator $number的所有组合的结果,并在我们只剩下一个$number时吐出结果。

请注意,我们原始表达式的最终解析版本中没有留下$expression个构造。那是因为$expression总是可以用我们的语言简化为其他东西的组合。

PHP非常相似:语言结构被认为是我们$number$operator的等价物。他们不能简化为其他语言结构;相反,它们是构建语言的基本单位。函数和语言结构之间的关键区别在于:解析器直接处理语言结构。它将函数简化为语言结构。

语言构造可能需要或不需要括号的原因以及某些语法具有返回值的原因而其他语句不具有完全取决于PHP解析器实现的特定技术细节。我不是很熟悉解析器的工作原理,所以我不能专门解决这些问题,但想象一下这个问题的第二种语言:

$expression := ($expression) | ...

实际上,这种语言可以自由地使用它找到的任何表达式并摆脱周围的括号。 PHP(在这里我使用纯粹的猜测)可能会为其语言结构使用类似的东西:print("Hello")可能在解析之前减少到print "Hello",反之亦然(语言定义可以添加括号为以及摆脱他们)。

这是为什么你不能重新定义像echoprint这样的语言结构的根本原因:它们被有效地硬编码到解析器中,而函数被映射到一组语言结构和解析器允许您在编译或运行时更改该映射,以替换您自己的一组语言结构或表达式。

在一天结束时,构造和表达式之间的内部差异是这样的:解析器理解并处理语言构造。语言提供的内置函数在解析之前被映射并简化为一组语言结构。

更多信息:

编辑:通过阅读其他一些答案,人们会提出好的观点。其中:

  • 内置语言比函数更快。这是正确的,如果只是边际,因为PHP解释器在解析之前不需要将该函数映射到其语言内置的等价物。但是,在现代机器上,差异可以忽略不计。
  • 内置语言绕过错误检查。这可能是也可能不是,这取决于每个内置的PHP内部实现。毫无疑问,函数通常会有更高级的错误检查和内置函数不具备的其他功能。
  • 语言结构不能用作函数回调。这是事实,因为构造不是函数。他们是独立的实体。当你对内置函数进行编码时,你不会编写一个带参数的函数 - 内置函数的语法由解析器直接处理,并被识别为内置函数而不是函数。 (如果你考虑使用具有一流功能的语言,这可能更容易理解:有效地,你可以将函数作为对象传递。你不能用内置函数来做。)

答案 1 :(得分:15)

语言结构由语言本身提供(如“if”,“while”,......等说明);因此他们的名字。

这样做的一个结果是它们比预定义或用户定义的函数更快被调用(或者我已多次听到/读过)

我不知道它是如何完成的,但他们可以做的一件事(因为直接集成到语言中)是“绕过”某种错误处理机制。例如,isset()可以与不存在的变量一起使用,而不会引起任何通知,警告或错误。

function test($param) {}
if (test($a)) {
    // Notice: Undefined variable: a
}

if (isset($b)) {
    // No notice
}

*请注意,所有语言的结构都不是这样。

函数和语言结构之间的另一个区别是,其中一些可以不带括号调用,比如关键字。

例如:

echo 'test'; // language construct => OK

function my_function($param) {}
my_function 'test'; // function => Parse error: syntax error, unexpected T_CONSTANT_ENCAPSED_STRING

在这里,所有语言结构都不是这样。

我认为绝对没有办法“禁用”语言结构,因为它是语言本身的一部分。另一方面,许多“内置”PHP函数并不是真正内置的,因为它们是由扩展提供的,因此它们始终是活动的(但不是全部)

另一个区别是语言结构不能用作“函数指针”(我的意思是,回调,例如):

$a = array(10, 20);

function test($param) {echo $param . '<br />';}
array_map('test', $a);  // OK (function)

array_map('echo', $a);  // Warning: array_map() expects parameter 1 to be a valid callback, function 'echo' not found or invalid function name

我现在脑子里还没有任何其他的想法...我对PHP的内部知识不太了...所以现在就是这样^^

如果你在这里没有得到多少答案,也许你可以向邮件列表内部(请参阅http://www.php.net/mailing-lists.php)询问这一点,那里有许多PHP核心开发人员;他们可能会知道那些东西^^

(我真的对其他答案感兴趣,顺便说一下^^)

作为参考:list of keywords and language constructs in PHP

答案 2 :(得分:4)

在浏览代码之后,我发现php解析了yacc文件中的一些语句。所以他们是特例。

(参见Zend / zend_language_parser.y)

除此之外,我认为不存在其他差异。

答案 3 :(得分:1)

你可以override built-in functions。关键词是永远的。