格式化长日期时间字符串以删除T字符

时间:2015-01-15 09:57:51

标签: c# regex xml

我有许多XML节点,它们将datetime对象输出为字符串。

问题在于,当输出时间戳和日期时,它们与T字符绑定在一起。

这是一个例子

  

2016-01-13T23:59:59

当然,XML中的所有节点都是不同的类型,因此按名称或类型进行分组是不可能的。我认为我唯一的选择是将模式与正则表达式匹配并以这种方式解决问题。

下面是XML如何工作的示例,您可以看到每个元素都被命名为不同的元素,但它们都遵循类似的模式,其中必须删除日期和时间之间的T并替换空格。

<dates>
    <1stDate> 2016-01-13T23:59:59 </1stdate>
    <2ndDate> 2017-01-13T23:55:57 </2ndDate>
    <3rdDate> 2018-01-13T23:22:19 </3rdDate>
</dates>

像这样输出的理想解决方案

2016-01-13 23:59:59 
2017-01-13 23:55:57 
2018-01-13 23:22:19

我以前不得不使用Regex,但我知道它是什么。我一直试图解码这个备忘单的含义http://regexlib.com/CheatSheet.aspx?AspxAutoDetectCookieSupport=1,但无济于事。

更新

//How each node is output
foreach (XText node in nodes)
{
    node.Value = node.Value.Replace("T"," "); // Where a date occurs, replace T with space. 
}

示例中提供的<date>元素可能包含XML格式的日期,但可能不包含单词date作为名称。

e.g。

<Start>  2017-01-13T23:55:57  </start>
<End>    2018-01-13T23:22:19  </End>
<FirstDate> 2018-01-13T23:22:19 </FirstDate>

我喜欢正则表达式解决方案的主要原因是因为我需要将日期字符串与可以确定其日期的模式匹配,然后我可以应用格式。

3 个答案:

答案 0 :(得分:4)

为什么不将该(完全有效的ISO-8601)日期时间解析为DateTime,然后使用内置字符串格式来生成可呈现的人类可读日期时间?

if (!string.IsNullOrWhiteSpace(node.Value))
{
    DateTime date;
    if (DateTime.TryParseExact(node.Value.Trim(),
        @"yyyy-MM-dd\THH:mm:ss", 
        CultureInfo.InvariantCulture, 
        DateTimeStyles.AssumeUniversal, 
        out date)
    {
        node.Value = date.ToString("yyyy-MM-dd HH:mm:ss");
    }
}

答案 1 :(得分:1)

我会用:

if (DateTime.TryParse(yourString))
{
     yourString.Replace("T", " ");
}

修改

如果你只想替换字母“T”的第一个实例,就像我认为你在 UPDATE 中建议的那样。您可以使用此扩展方法:

public static string ReplaceFirst(this string text, string search, string replace)
{
   int pos = text.IndexOf(search);
   if (pos < 0)
   {
      return text;
   }
   return text.Substring(0, pos) + replace + text.Substring(pos + search.Length);
 }

你可以像以下一样使用它:

yourString.ReplaceFirst("T", " ");

答案 2 :(得分:1)

如果您仍想使用正则表达式执行此操作,则以下表达式应该可以解决这个问题:

# Positive lookbehind for date part which consists of numbers and dashes
(?<=[0-9-]+)
# Match the T in between
T
# Positive lookahead for time part which consists of numbers and colons
(?=[0-9:]+)

修改

上面的正则表达式将 NOT 检查字符串是否采用日期/时间格式。这是一种通用模式。要为您的字符串强加格式,请使用以下模式:

# Positive lookbehind for date part
(?<=\d{4}(-\d{2}){2})
# Match the T
T
# Positive lookahead for time part
(?=\d{2}(:\d{2}){2})

同样,这将与您拥有的字符串完全匹配,但您应使用它来验证日期/时间值,因为它将匹配2015-15-10T24:12:10等无效日期;使用DateTime.Parse()DateTime.TryParse()方法验证日期/时间值。