度分秒(DMS)RegEx

时间:2012-11-28 18:09:49

标签: java regex latitude-longitude

我有一个正则表达式,我希望以各种方式匹配纬度/经度对,例如。

123 34 42
-123* 34' 42"
123* 34' 42"
+123* 34' 42"
45* 12' 22"N
45 12' 22"S
90:00:00.0N

我希望能够在一对中匹配这些

90:00:00.0N 180:00:00.0E是纬度/经度对。

45* 12' 22"N 46* 12' 22"E是纬度/经度对(1度1度单元格)。

123* 34' 42" 124* 34' 42"是纬度/经度对

使用下面的正则表达式,当我输入123时,它匹配。我想这是真的,因为123 00 00是一个有效的坐标。但是,我想使用这个正则表达式匹配上面相同格式的对

   "([-|\\+]?\\d{1,3}[d|D|\u00B0|\\s](\\s*\\d{1,2}['|\u2019|\\s])?"
 + "(\\s*\\d{1,2}[\"|\u201d|\\s])?\\s*([N|n|S|s|E|e|W|w])?\\s?)"

我正在使用Java。

* 表示学位。

我在正则表达式中做错了什么?

3 个答案:

答案 0 :(得分:8)

嗯,首先,你用一堆不必要的管道字符填充你的字符集 - []对中暗示了交替。额外的清理:+不需要在字符类中进行转义。你的正则表达式似乎正在解决比你给我们更大的问题陈述 - 你没有提到dD作为匹配字符。你已经完成了RegEx可选的整个后半部分。关于我认为原始问题陈述的内容,我构建了以下正则表达式:

^\s*([+-]?\d{1,3}\*?\s+\d{1,2}'?\s+\d{1,2}"?[NSEW]?|\d{1,3}(:\d{2}){2}\.\d[NSEW]\s*){1,2}$

这有点儿不合适,但是我会为你或任何在未来遇到这种情况的人(你好,未来!)打破它。

^

字符串的开头,简单。

\s*

任何数量的空白 - 甚至没有。

( 

表示一个小组的开头 - 我们将回到那个。

[-+]?

可选标志

\d{1,3}

1到3位

\*?

可选的星号 - 这里的转义是星号的关键,但是如果你想用实际程度的unicode代码点替换它,你将不需要它。

\s+

至少有一个空白字符

\d{1,2}

1或2位数。

'?

可选撇号

\s+\d{1,2}+

你以前见过这些,但是有一个新的曲线球 - 在{1,2}量词之后有一个加号!这使得它成为所有格量词,这意味着匹配器不会放弃该组的匹配以使另一个可能。这几乎完全是为了防止1 1 11 1 1匹配,但可以用来在100%确定您不需要回溯的任何地方提高速度。

"?

可选双引号。你必须在Java中逃避这一点。

[NSEW]?

可选的基本方向,用字母

表示
|

或者 - 您可以在此之前匹配组中的所有内容,或者在此之后匹配组中的所有内容。

\d{1,3}

旧消息。

(:\d{2})

冒号,后跟两个字符......

{2}

两次!

\.\d

小数点,后跟一位数。

[NSEW]

与以前相同,但这次是强制性的。

\s*)
有些空间,最后是小组的结尾。现在,第一组已匹配整个经度/纬度表示,最后具有任意数量的空间。紧随其后:

{1,2}

做一次或两次 - 以匹配单个或一对,最后:

$

字符串的结尾。

这并不完美,但它非常接近,我认为它回答了最初的问题陈述。另外,我觉得我的解释已经揭开神秘面纱,你可以编辑它以进一步满足你的需求。它没有(也不会)做的一件事就是强制第一个坐标与第二个坐标相匹配。这对于正则表达式的要求太多了。

怀疑者:Here it is in action。请享受。

答案 1 :(得分:1)

一般来说,我不认为这是一个好方法。 在您的界面中尝试以一种特定格式获得DMS坐标 用户应在3个单独的文本字段中输入。

此外这个正则表达式不太可维护。

标记DMS坐标的可能性要大得多, 你甚至无法想象。人类很有创意。

例如:

将N,S放在前面 或:北,157度50分55.796秒
或者:来自维基:NGS现在在1993年说这一点是21-18-02.54891 N 157-50-45.90280 W

答案 2 :(得分:0)

我不是一个RE向导,但如果您正在从一个文本框进行解析,那么使用您的格式,您需要有一些约定,哪一对首先(可能是纬度)。

从那里,你有六个数字字段(每个可能有一个小数点的deg,min,sec),两个符号(每个+或 - )和最多两个半球(每个半球)。

据我所知,如果你只要求纬度为第一,经度为第二,那么每次从输入中解析这8-10个字段的顺序会相同。其余符号(保存小数点)可以基本上作为分隔符处理。

这会让它变得更容易吗?