如果我们从代码中设置时区,为什么date()的工作速度要快两倍?

时间:2011-04-05 18:39:35

标签: php datetime timezone micro-optimization

如果您在任何date()来电之前在脚本中设置了实际时区,您是否注意到date()功能比正常情况快2倍?我对此非常好奇。

看看这段简单的代码:

<?php

  $start = microtime(true);
  for ($i = 0; $i < 100000; $i++) date('Y-m-d H:i:s');
  echo (microtime(true) - $start);

?>

它只使用date()循环调用for函数100,000次。我得到的结果总是在 1.6秒(Windows,PHP 5.3.5),但是......

如果我在开始之前再次设置相同的时区添加一条荒谬的行:

date_default_timezone_set(date_default_timezone_get());

我的时间低于 800毫秒;快2倍(同一台服务器)。

我四处寻找这种行为的任何合理解释,但没有任何成功。从我的角度来看,这个额外的行没用,但PHP不同意我的看法。

我已经在两个Linux服务器(不同的PHP版本)上尝试过这个测试,结果时间不同但比例 ~6:1

注意: php.ini 中的 date.timezone 属性已正确设置(欧洲/巴黎)。

我在这里搜索相关问题并没有找到类似的东西。我还检查了date_default_time_zone() function @ php.net的手册,发现我不仅是一个注意到这一点的人,但仍然无法理解为什么会这样?

任何?

2 个答案:

答案 0 :(得分:41)

PHP 5.4的更新:

date_default_timezone_get的描述中所述,从PHP 5.4.0开始,算法从系统信息has been removed from the code猜测时区(与PHP 5.3源对比),因此这种行为不再存在。

在我的开发服务器上运行计时测试以查看它的运行情况,我得到了:

  • PHP 5.3.11:~720ms
  • PHP 5.4.3:~470ms

原始答案:

我刚刚查看了PHP源代码。具体而言,所有相关代码都在/ext/date/php_date.c

我首先假设如果您没有为date提供时区,则会调用date_default_timezone_get来获取一个时区。 Here's that function

PHP_FUNCTION(date_default_timezone_get)
{
    timelib_tzinfo *default_tz;

    default_tz = get_timezone_info(TSRMLS_C);
    RETVAL_STRING(default_tz->name, 1);
}

好的,get_timezone_info看起来像什么? This

PHPAPI timelib_tzinfo *get_timezone_info(TSRMLS_D)
{
    char *tz;
    timelib_tzinfo *tzi;

    tz = guess_timezone(DATE_TIMEZONEDB TSRMLS_CC);
    tzi = php_date_parse_tzfile(tz, DATE_TIMEZONEDB TSRMLS_CC);
    if (! tzi) {
        php_error_docref(NULL TSRMLS_CC, E_ERROR, "Timezone database is corrupt - this should *never* happen!");
    }
    return tzi;
}

guess_timezone怎么样? Here它是:

static char* guess_timezone(const timelib_tzdb *tzdb TSRMLS_DC)
{
    char *env;

    /* Checking configure timezone */
    if (DATEG(timezone) && (strlen(DATEG(timezone)) > 0)) {
        return DATEG(timezone);
    }
    /* Check environment variable */
    env = getenv("TZ");
    if (env && *env && timelib_timezone_id_is_valid(env, tzdb)) {
        return env;
    }
    /* Check config setting for default timezone */
    /*  ..... code omitted ....... */
#if HAVE_TM_ZONE
    /* Try to guess timezone from system information */
    /*  ..... code omitted ....... */
#endif
#ifdef PHP_WIN32
    /*  ..... code omitted ....... */
#elif defined(NETWARE)
    /*  ..... code omitted ....... */
#endif
    /* Fallback to UTC */
    php_error_docref(NULL TSRMLS_CC, E_WARNING, DATE_TZ_ERRMSG "We had to select 'UTC' because your platform doesn't provide functionality for the guessing algorithm");
    return "UTC";
}

好的,那么它与date_default_timezone_set如何互动?让我们看一下that function

PHP_FUNCTION(date_default_timezone_set)
{
    char *zone;
    int   zone_len;

    if (zend_parse_parameters(ZEND_NUM_ARGS() TSRMLS_CC, "s", &zone, &zone_len) == FAILURE) {
        RETURN_FALSE;
    }
    if (!timelib_timezone_id_is_valid(zone, DATE_TIMEZONEDB)) {
        php_error_docref(NULL TSRMLS_CC, E_NOTICE, "Timezone ID '%s' is invalid", zone);
        RETURN_FALSE;
    }
    if (DATEG(timezone)) {
        efree(DATEG(timezone));
        DATEG(timezone) = NULL;
    }
    DATEG(timezone) = estrndup(zone, zone_len);
    RETURN_TRUE;
}

长话短说:如果你拨打date_default_timezone_set一次,那么guess_timezone会从timezone变量中读取快速读取路径(第一个条件满足,并立即返回) 。否则需要一些时间来计算默认时区,这个时区没有缓存(我想简单来说),如果你在循环中这样做,延迟开始显示。

答案 1 :(得分:2)

我认为除非明确指定,否则每次调用时都必须确定自己的时区,这会增加函数运行时。

但是真的,这有关系吗?你有多少脚本可以使这个通话日期()每次运行100,000次?