提升正则表达式如何将这样的PHP unescape函数转换为C ++?

时间:2011-07-24 16:04:23

标签: php regex boost boost-regex html-escape-characters

我必须create CMS in PHP 我创建了一个简单的unescape html函数,如下所示:

function unescape($s) {
    $s= preg_replace('/%u(....)/', '&#x$1;', $s);
    $s= preg_replace('/%(..)/', '&#x$1;', $s);
return $s;
}

如何使用Boost.Regex将其翻译成C ++?

1 个答案:

答案 0 :(得分:1)

我猜它看起来有点像这样:

std::string unescape(const std::string s)
{
  std::string temp = boost::regex_replace(s, "%u(....)", "&#x$1;", boost::match_default);
  temp = boost::regex_replace(temp, "%u(..)", "&#x$1;", boost::match_default);
  return temp;
}

但我认为.(DOT)应该只匹配十六进制值,在这种情况下我会选择这样的东西:

std::string unescape(const std::string s)
{
  return boost::regex_replace(s, "%u([0-9a-fA-F]{2}|[0-9a-fA-F]{4})", "&#x$1;",
                              boost::match_default);
}

(请注意,我没有对此进行测试!)