有没有办法找到匹配DateTime格式字符串的第一个字符串?

时间:2013-07-08 00:17:50

标签: c# .net datetime-format datetime-parsing

给定日期时间格式字符串,是否有一种标准方法可以找到匹配该格式的第一个匹配子字符串?

例如,给定......

d-MMM-yy H:mm:ss

和一些文字......

"blah 1 2 3 7-Jul-13 6:15:00 4 5 6 blah"

我希望它能够回归

"7-Jul-13 6:15:00"

现在我可以通过解析找到这个字符串,但我想知道是否有任何库支持这样做?

6 个答案:

答案 0 :(得分:8)

这可能不是最有效的,但它似乎是一个有趣的问题,所以我想我会尝试这种方法。

它采用您的DateTime格式字符串,并通过用.和空格\\s替换任何字母来制作正则表达式字符串模式。然后它从该模式中创建一个Regex对象,并尝试在输入句子中找到第一个匹配。

该匹配(如果存在)将被传递到DateTime.TryParseExact调用。我确信可以进行改进,但这可能有助于对不需要对正则表达式进行硬编码或输入句子格式的技术提出一般性建议。

string inputSentence = "blah 1 2 3 7-Jul-13 6:15:00 4 5 6 blah";

string dtformat = "d-MMM-yy H:mm:ss";

//convert dtformat into regex pattern
StringBuilder sb = new StringBuilder();
foreach (char c in dtformat)
{
    if (Char.IsLetter(c))
    {
       if (char.ToUpperInvariant(c) == 'D' || char.ToUpperInvariant(c) == 'H' || char.ToUpperInvariant(c) == 'S')            
          sb.Append(".{1,2}");
       else
          sb.Append(".");
    }
    else if(Char.IsWhiteSpace(c))        
       sb.Append("\\s");
    else
       sb.Append(c);
}


string dtPattern = sb.ToString();

Regex dtrx = new Regex(dtPattern);

//get the match using the regex pattern
var dtMatch = dtrx.Match(inputSentence);

if(dtMatch != null)
{
    string firstString = dtMatch.Value.Trim();

    //try and parse the datetime from the string
    DateTime firstMatch;
    if (DateTime.TryParseExact(dstr, dtformat, null, DateTimeStyles.None, out firstMatch))
    {
       Console.WriteLine("Parsed");
    }
    else
    {
       Console.WriteLine("Could not parse");
    }
}

答案 1 :(得分:7)

也许是这样的:

通过解析文本中的每个单词找到格式字符串的每个部分,并将2结合起来创建DateTime

string test = "blah 1 2 3 7-Jul-13 6:15:00  4 5 6 blah";

int formatPart = 0;
bool dateFound = false;
string format = "d-MMM-yy H:mm:ss";
DateTime myDateTime = DateTime.MinValue;
foreach (var item in test.Split(' '))
{
    DateTime dummy;
    if (DateTime.TryParseExact(item, format.Split(' ')[formatPart], null, DateTimeStyles.NoCurrentDateDefault, out dummy))
    {
        if (myDateTime == DateTime.MinValue)
        {
            formatPart++;
            myDateTime = dummy;
            dateFound = myDateTime.Date != DateTime.MinValue.Date;
            continue;
        }

        // If date was found first, add time, else add date
        myDateTime = dateFound
         ? myDateTime.Add(new TimeSpan(dummy.Hour, dummy.Minute, dummy.Second))
         : dummy.Add(new TimeSpan(myDateTime.Hour, myDateTime.Minute, myDateTime.Second));
        break;
    }
}

测试:

Input: "blah 1 2 3 7-Jul-13 6:15:00  4 5 6 blah"
Format: "d-MMM-yy H:mm:ss"

Input: "blah 1 2 3 6:15:00 7-Jul-13 4 5 6 blah"
Format: "H:mm:ss d-MMM-yy"

Input: "blah 1 2 3 6:15:00 7-7-2013 4 5 6 blah"
Format: "H:mm:ss d-M-yyyy"

Input: "blah 1 2 3 07-07-2013 6:15:00  4 5 6 blah"
Format: "dd-MM-yyyy H:mm:ss" 

答案 2 :(得分:1)

您可以尝试NodaTime

var input = "blah 1 2 3 7-Jul-13 6:15:00 4 5 6 blah";
var pattern = "d-MMM-yy H:mm:ss";
var nodaPattern = NodaTime.Text
    .LocalDateTimePattern
    .Create(pattern, System.Globalization.CultureInfo.CurrentUICulture);
for (int i = 0; i < input.Length - pattern.Length; i++)
{
    var result = nodaPattern.Parse(input.Substring(i, pattern.Length));
    if (result.Success)
    {
        Console.WriteLine(result.Value);
        break;
    }
}

答案 3 :(得分:0)

我不知道除了DateTime.TryParse之外的任何东西(或者说是RegEx)在.NET中执行此操作。

我会设置一个流标记器,只将候选标记对传递给DateTime.TryParse(基于最小字符串长度的一些组合,可能是子标记检查标记0上的一对破折号和标记1上的一对冒号)精确检查将取决于您支持的日期/时间格式

答案 4 :(得分:0)

您可以尝试使用正则表达式:

^[0-9]+-[a-z A-z]+-[0-9]+\s[0-9]+:[0-9]+:[0-9]+

答案 5 :(得分:0)

你可以试试这个:

string original = "blah 1 2 3 7-jul-13 6:15:00 4 5 6 blah";
Match mc = Regex.Match(original, @"\s*(?<date>\d+[-/][A-Z]{3}[-/]\d+)\s*([01]?[0-9]|2[0-3]):[0-5][0-9]:[0-5][0-9]", RegexOptions.IgnoreCase);

if (mc.Success)
{
    string datetime = mc.Groups[0].Value;
}