我目前正在使用Java,但是遇到一个问题,使用正则表达式匹配JSON字符串中的多种日期格式。
JSON:
{"x": "02/23/2019", "y": "02-27-2019"}
正则表达式:
[0-9]{1,2}(/|-)[0-9]{1,2}(/|-)[0-9]{4}
在正则表达式测试器中,此正则表达式匹配两个日期。但是在Java代码中,我只能从小组中得到一个约会。第二组只是一个“ \”。
Java代码:
private static void findDates() {
String regex = "[0-9]{1,2}(/|-)[0-9]{1,2}(/|-)[0-9]{4}";
Pattern pattern = Pattern.compile(regex, Pattern.MULTILINE);
String json =
"{\"x\":\"02/23/2019\",\n" +
"\"y\":\"02-27-2019\"}";
Matcher matcher = pattern.matcher(json);
if (matcher.find()) {
for (int i = 0; i < matcher.groupCount(); i++) {
String dateMatch = matcher.group(i);
System.out.println(dateMatch);
}
System.out.println(json);
}
}
我需要能够捕获所有与正则表达式指定的格式匹配的日期。因此,如果JSON中碰巧有三个日期采用MM / dd / yyyy或MM-dd-yyyy格式,则当我遍历组时,我应该获取所有三个日期,或者所有五个日期,或者所有两个日期,等等。 ..
答案 0 :(得分:3)
您的代码有点不正确。当您尝试查找所有匹配项时,需要使用while(matcher.find())
。您也可以将(/|-)
写为[/-]
。查看此Java代码。
String regex = "[0-9]{1,2}([/-])[0-9]{1,2}\\1[0-9]{4}";
Pattern pattern = Pattern.compile(regex);
String json = "{\"x\":\"02/23/2019\",\n" + "\"y\":\"02-27-2019\"}";
Matcher matcher = pattern.matcher(json);
while (matcher.find()) {
System.out.println(matcher.group());
}
打印两个日期,
02/23/2019
02-27-2019
注意,我在正则表达式的年份部分之前写了\\1
而不是([/-])
,因此它与格式02-23/2019
或02/23-2019
的日期不匹配,并且而是仅02-23-2019
和02/23/2019
此外,在您的代码中,如果您使用if (matcher.find())
,则匹配器将首先查找并且不会在字符串中找到其他匹配项,即使其中许多匹配项确实存在。而matcher.groupCount()
只是动态地为您提供了匹配的正则表达式中的组数,您可以使用它们来打印所有组捕获的内容,这并不是您程序中的意图。
答案 1 :(得分:0)
如果您正在播放数量有限的无歧义格式,只需尝试使用LocalDate
和DateTimeFormatter
类进行解析。那就是他们的目的。
定义格式模式以匹配您的预期输入。
List < String > inputs = List.of( "02/23/2019" , "02-27-2019" , "07|07|2022" );
List < DateTimeFormatter > formatters =
List.of(
DateTimeFormatter.ofPattern( "MM/dd/uuuu" ) ,
DateTimeFormatter.ofPattern( "MM-dd-uuuu" )
);
收集结果以及错误的(意外的)输入。
List < LocalDate > results = new ArrayList <>( inputs.size() );
List < String > faultyInputs = new ArrayList <>();
环绕输入。对于每个字符串,循环定义的格式化程序。如果一个格式化程序成功(匹配您输入的格式并成功解析),请收集结果。否则,如果没有格式化程序与输入匹配,请收集错误的输入。
for ( String input : inputs )
{
LocalDate ld = null;
for ( DateTimeFormatter formatter : formatters )
{
try
{
ld = LocalDate.parse( input , formatter );
results.add( ld );
break; // Bail-out of looping the formatters. If a format matched, no need to try others.
} catch ( DateTimeParseException e )
{
// Swallow exception. No code needed here.
}
}
if ( Objects.isNull( ld ) ) // If we tried all the expected formats but not matched our input…
{
faultyInputs.add( input );
}
}
转储到控制台。
System.out.println( "results:" );
System.out.println( results );
System.out.println( "faultyInputs:" );
System.out.println( faultyInputs );
结果:
[2019-02-23,2019-02-27]
faultyInputs:
[07 | 07 | 2022]
提示:教育任何产生有关ISO 8601欢乐的数据的人。使用本地化或发明格式以文本形式交换日期时间值是不明智的做法。
java.time框架已内置在Java 8及更高版本中。这些类取代了麻烦的旧legacy日期时间类,例如java.util.Date
,Calendar
和SimpleDateFormat
。
要了解更多信息,请参见Oracle Tutorial。并在Stack Overflow中搜索许多示例和说明。规格为JSR 310。
目前位于Joda-Time的maintenance mode项目建议迁移到java.time类。
您可以直接与数据库交换 java.time 对象。使用符合JDBC driver或更高版本的JDBC 4.2。不需要字符串,不需要java.sql.*
类。
在哪里获取java.time类?
ThreeTen-Extra项目使用其他类扩展了java.time。该项目为将来可能在java.time中添加内容提供了一个试验场。您可能会在这里找到一些有用的类,例如Interval
,YearWeek
,YearQuarter
和more。