日期字符串到纪元秒(UTC)

时间:2019-08-01 07:55:13

标签: c++ date utc epoch datetime-parsing

问题

我想将以字符串(UTC)给出的日期时间解析为自 epoch 以来的秒数。示例(请参见EpochConverter):

2019-01-15 10:00:00 -> 1547546400

问题

这个简单的解决方案也被一个非常相关的问题C++ Converting a time string to seconds from the epoch接受,std::string -> std::tm -> std::time_t使用std::get_time然后使用std::mktime

std::tm tm;
std::stringstream ss("2019-01-15 10:00:00");
ss >> std::get_time(&tm, "%Y-%m-%d %H:%M:%S");
std::time_t epoch = std::mktime(&tm);
// 1547546400 (expected)
// 1547539200 (actual, 2 hours too early)

但是std::mktime似乎由于时区而浪费时间。我正在执行UTC+01:00中的代码,但该日期也有DST,因此此处为+2

tm之后的15字段中,hour显示std::get_time。进入std::mktime后,它就一团糟。

因此,再次将字符串解释为 UTC 时间戳,不涉及任何时区。但是我想出的所有解决方案似乎都将其解释为本地时间戳,并为其添加偏移量。


限制

我对此有一些限制:

  • C ++ 17
  • 与平台/编译器无关
  • 没有环境变量被黑客入侵
  • 没有外部库(例如boost)

尽管为了问答,也可以随意发布涉及这些答案的答案,但是我不会接受。


研究

我找到了解决此问题的各种尝试,但没有一个满足我的要求:

  • std::mktime(如上所述),因为它假定了本地时间,所以弄乱了时间
  • strptime,在我的平台上不可用,不是标准的一部分
  • timegm(这正是我所需要的),而不是与平台无关的
  • _mkgmtime,与平台无关
  • boost::posix_time::from_iso_string是一个外部库
  • std::chrono::date::parse,不适用于C ++ 17
  • 使用tzset清除并重置时区变量,使用环境变量 hacking
  • mktime(localtime(&timestamp)) - mktime(gmtime(&timestamp))手动抵消偏移量,计算出错误的偏移量,因为它不考虑DST(在我的平台上为1小时,但需要2小时)

2 个答案:

答案 0 :(得分:1)

我最近有同样的要求。令我感到失望的是,发现在编写时间戳和解析时间戳之间,DST和时区的处理似乎不一致。

我想到的代码是这样的:

void time_point_from_stream(std::istream &is, system_clock::time_point &tp)
{
    std::tm tm {};
    is >> std::get_time(&tm, "%Y-%m-%dT%H:%M:%S");

    // unhappily, mktime thinks it's reading local time with DST adjustments
    auto my_time_t = std::mktime(&tm);
    my_time_t += tm.tm_gmtoff;

    if (tm.tm_isdst == 1)
        my_time_t -= 3600;

    tp = system_clock::from_time_t(my_time_t);

    if (not is)
        return;
    auto ch = is.peek();

    if (std::isspace(ch))
        return;

    if (ch == '.')
    {
        double zz;
        is >> zz;
        auto zseconds = std::chrono::duration< double >(zz);
        tp += chrono::duration_cast< system_clock::duration >(zseconds);
        if (not is)
            return;
        ch = is.peek();
    }

    if (ch == 'Z')
        is.get();
    else if (not isspace(ch))
    {
        is.setstate(std::ios::failbit);
    }
}

基本上,这些步骤是:

  1. 使用std::get_time来填充tm
  2. 使用std::mktime将其转换为time_t
  3. 撤消时区和夏令时调整
  4. 转换为std::chrono::system_clock::time_point
  5. 解析小数秒并调整结果。

我相信c ++ 20可以改善这种情况。

Howard Hinnant还编写了一个改进的日期/时间库。我一直发现还有boost::posix_timestd产品更易于使用。

答案 1 :(得分:1)

C ++ 20之前的解决方案:自行开发。

给出正确的文档,它确实比听起来容易得多,如果不需要太多错误检测,甚至可以快如闪电。

第一个问题是解析数字而不处理任何数字。您只需要读取2位数和4位数长度的无符号值,就可以做到这一点:

int
read2(std::string const& str, int pos)
{
    return (str[pos] - '0')*10 + (str[pos+1]  - '0');
}

int
read4(std::string const& str, int pos)
{
    return (str[pos] - '0')*1000 + (str[pos+1] - '0')*100 +
           (str[pos+2] - '0')*10 + (str[pos+3]  - '0');
}

现在有了一个字符串,很容易解析出您需要的不同值:

// yyyy-mm-dd hh:MM:ss -> count of non-leap seconds since 1970-01-01 00:00:00 UTC
// 0123456789012345678
long long
EpochConverter(std::string const& str)
{
    auto y = read4(str, 0);
    auto m = read2(str, 5);
    auto d = read2(str, 8);
    ...

通常使人绊倒的部分是如何将三元组{y, m, d}转换为自1970-01-01年之前/之前的天数。这是一个collection of public domain calendrical algorithms,可以帮助您完成此操作。这不是第三方的日期/时间库,不是。这是一个有关算法的教程,您需要编写自己的日期/时间库。并且这些算法效率。没有迭代。没有大桌子。这使得它们非常流水线并且对缓存友好。并且它们已经过+/-一百万年的时间进行了单元测试。因此,您不必担心会碰到任何正确性边界。如果您对它们的工作方式感兴趣,这些算法也有非常深入的推论。

因此,只需转到collection of public domain calendrical algorithms,选择所需的算法(并根据需要自定义它们),然后滚动自己的转换器即可。

例如:

#include <cstdint>
#include <limits>
#include <string>

int
days_from_civil(int y, unsigned m, unsigned d) noexcept
{
    static_assert(std::numeric_limits<unsigned>::digits >= 18,
             "This algorithm has not been ported to a 16 bit unsigned integer");
    static_assert(std::numeric_limits<int>::digits >= 20,
             "This algorithm has not been ported to a 16 bit signed integer");
    y -= m <= 2;
    const int era = (y >= 0 ? y : y-399) / 400;
    const unsigned yoe = static_cast<unsigned>(y - era * 400);      // [0, 399]
    const unsigned doy = (153*(m + (m > 2 ? -3 : 9)) + 2)/5 + d-1;  // [0, 365]
    const unsigned doe = yoe * 365 + yoe/4 - yoe/100 + doy;         // [0, 146096]
    return era * 146097 + static_cast<int>(doe) - 719468;
}

int
read2(std::string const& str, int pos)
{
    return (str[pos] - '0')*10 + (str[pos+1]  - '0');
}

int
read4(std::string const& str, int pos)
{
    return (str[pos] - '0')*1000 + (str[pos+1] - '0')*100 +
           (str[pos+2] - '0')*10 + (str[pos+3]  - '0');
}

// yyyy-mm-dd hh:MM:ss -> count of non-leap seconds since 1970-01-01 00:00:00 UTC
// 0123456789012345678
long long
EpochConverter(std::string const& str)
{
    auto y = read4(str, 0);
    auto m = read2(str, 5);
    auto d = read2(str, 8);
    auto h = read2(str, 11);
    auto M = read2(str, 14);
    auto s = read2(str, 17);
    return days_from_civil(y, m, d)*86400LL + h*3600 + M*60 + s;
}

#include <iostream>

int
main()
{
    std::cout << EpochConverter("2019-01-15 10:00:00") << '\n';
}

这只是对我的输出:

1547546400

添加适合您的应用程序的错误检测。