在JSON字符串中查找多种日期格式

时间:2019-02-25 17:47:04

标签: java regex date

我目前正在使用Java,但是遇到一个问题,使用正则表达式匹配JSON字符串中的多种日期格式。

JSON:

{"x": "02/23/2019", "y": "02-27-2019"}

正则表达式:

[0-9]{1,2}(/|-)[0-9]{1,2}(/|-)[0-9]{4}

在正则表达式测试器中,此正则表达式匹配两个日期。但是在Java代码中,我只能从小组中得到一个约会。第二组只是一个“ \”。

Java代码:

private static void findDates() {
    String regex = "[0-9]{1,2}(/|-)[0-9]{1,2}(/|-)[0-9]{4}";
    Pattern pattern = Pattern.compile(regex, Pattern.MULTILINE);
    String json =
            "{\"x\":\"02/23/2019\",\n" +
             "\"y\":\"02-27-2019\"}";
    Matcher matcher = pattern.matcher(json);
    if (matcher.find()) {
        for (int i = 0; i < matcher.groupCount(); i++) {
            String dateMatch = matcher.group(i);
            System.out.println(dateMatch);
        }
        System.out.println(json);
    }
}

我需要能够捕获所有与正则表达式指定的格式匹配的日期。因此,如果JSON中碰巧有三个日期采用MM / dd / yyyy或MM-dd-yyyy格式,则当我遍历组时,我应该获取所有三个日期,或者所有五个日期,或者所有两个日期,等等。 ..

2 个答案:

答案 0 :(得分:3)

您的代码有点不正确。当您尝试查找所有匹配项时,需要使用while(matcher.find())。您也可以将(/|-)写为[/-]。查看此Java代码。

String regex = "[0-9]{1,2}([/-])[0-9]{1,2}\\1[0-9]{4}";
Pattern pattern = Pattern.compile(regex);
String json = "{\"x\":\"02/23/2019\",\n" + "\"y\":\"02-27-2019\"}";

Matcher matcher = pattern.matcher(json);
while (matcher.find()) {
    System.out.println(matcher.group());
}

打印两个日期,

02/23/2019
02-27-2019

注意,我在正则表达式的年份部分之前写了\\1而不是([/-]),因此它与格式02-23/201902/23-2019的日期不匹配,并且而是仅02-23-201902/23/2019

此外,在您的代码中,如果您使用if (matcher.find()),则匹配器将首先查找并且不会在字符串中找到其他匹配项,即使其中许多匹配项确实存在。而matcher.groupCount()只是动态地为您提供了匹配的正则表达式中的组数,您可以使用它们来打印所有组捕获的内容,这并不是您程序中的意图。

答案 1 :(得分:0)

正则表达式过大了

如果您正在播放数量有限的无歧义格式,只需尝试使用LocalDateDateTimeFormatter类进行解析。那就是他们的目的。

定义格式模式以匹配您的预期输入。

List < String > inputs = List.of( "02/23/2019" , "02-27-2019" , "07|07|2022" );
List < DateTimeFormatter > formatters =
        List.of(
                DateTimeFormatter.ofPattern( "MM/dd/uuuu" ) ,
                DateTimeFormatter.ofPattern( "MM-dd-uuuu" )
        );

收集结果以及错误的(意外的)输入。

List < LocalDate > results = new ArrayList <>( inputs.size() );
List < String > faultyInputs = new ArrayList <>();

环绕输入。对于每个字符串,循环定义的格式化程序。如果一个格式化程序成功(匹配您输入的格式并成功解析),请收集结果。否则,如果没有格式化程序与输入匹配,请收集错误的输入。

for ( String input : inputs )
{
    LocalDate ld = null;
    for ( DateTimeFormatter formatter : formatters )
    {
        try
        {
            ld = LocalDate.parse( input , formatter );
            results.add( ld );
            break; // Bail-out of looping the formatters. If a format matched, no need to try others.
        } catch ( DateTimeParseException e )
        {
            // Swallow exception. No code needed here.
        }
    }
    if ( Objects.isNull( ld ) ) // If we tried all the expected formats but not matched our input…
    {
        faultyInputs.add( input );
    }
}

转储到控制台。

System.out.println( "results:" );
System.out.println( results );
System.out.println( "faultyInputs:" );
System.out.println( faultyInputs );
  

结果:

     

[2019-02-23,2019-02-27]

     

faultyInputs:

     

[07 | 07 | 2022]

ISO 8601

提示:教育任何产生有关ISO 8601欢乐的数据的人。使用本地化或发明格式以文本形式交换日期时间值是不明智的做法。


关于 java.time

java.time框架已内置在Java 8及更高版本中。这些类取代了麻烦的旧legacy日期时间类,例如java.util.DateCalendarSimpleDateFormat

要了解更多信息,请参见Oracle Tutorial。并在Stack Overflow中搜索许多示例和说明。规格为JSR 310

目前位于Joda-Timemaintenance mode项目建议迁移到java.time类。

您可以直接与数据库交换 java.time 对象。使用符合JDBC driver或更高版本的JDBC 4.2。不需要字符串,不需要java.sql.*类。

在哪里获取java.time类?

ThreeTen-Extra项目使用其他类扩展了java.time。该项目为将来可能在java.time中添加内容提供了一个试验场。您可能会在这里找到一些有用的类,例如IntervalYearWeekYearQuartermore