请在标记为重复之前阅读
我无法创建或找到适用于所有 IPv6格式的RegEx(我的测试用例如下)。我知道每个人都指出的这个问题:Regular expression that matches valid IPv6 addresses但是,它们都将IPv6与IPv4结合使用和/或不适用于我的所有测试用例。
要求:
Coldfusion
的模式和一个适用于PL/SQL
的模式。PL/SQL
中使用它,所以它的模式必须保持低于512个字符。 Oracle只支持RegExp语言的一小部分。因此,ColdFusion
模式最终可能与PL/SQL
模式不同,只要它们都有效,就没问题了。这是我正在尝试的最新模式:
^(?>(?>([a-f0-9]{1,4})(?>:(?1)){7}|(?!(?:.*[a-f0-9](?>:|$)){8,})((?1)(?>:(?1)){0,6})?::(?2)?)|(?>(?>(?1)(?>:(?1)){5}:|(?!(?:.*[a-f0-9]:){6,})(?3)?::(?>((?1)(?>:(?1)){0,4}):)?)?(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(?>\.(?4)){3}))$
ColdFusion
接近但不是100%。它在PL/SQL
中根本不起作用。
测试结果 http://regex101.com/r/wI8cI0 粗体项是ColdFusion
中模式不起作用的项目:
::
实际上是一种有效的格式,感谢@Sander Steffann。)我从http://publib.boulder.ibm.com/infocenter/iseries/v5r3/index.jsp?topic=%2Frzai2%2Frzai2ipv6addrformat.htm获得了8-11的测试用例 并被告知:测试9和11是IPv6地址前缀,而不是IPv6地址,所以那些不应该匹配。
最终结果,我需要它们在这样的语句中工作:
ColdFusion的:
<cfset IndexOfOccurrence1=REFind("^(?>(?>([a-f0-9]{1,4})(?>:(?1)){7}|(?!(?:.*[a-f0-9](?>:|$)){8,})((?1)(?>:(?1)){0,6})?::(?2)?)|(?>(?>(?1)(?>:(?1)){5}:|(?!(?:.*[a-f0-9]:){6,})(?3)?::(?>((?1)(?>:(?1)){0,4}):)?)?(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(?>\.(?4)){3}))$",value[i])>
PL / SQL:
if ( REGEXP_LIKE(v,'^(?>(?>([a-f0-9]{1,4})(?>:(?1)){7}|(?!(?:.*[a-f0-9](?>:|$)){8,})((?1)(?>:(?1)){0,6})?::(?2)?)|(?>(?>(?1)(?>:(?1)){5}:|(?!(?:.*[a-f0-9]:){6,})(?3)?::(?>((?1)(?>:(?1)){0,4}):)?)?(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(?>\.(?4)){3}))$','i') ) then
答案 0 :(得分:2)
据我研究,没有适用于所有IPv6格式的RegEx。即便如此,它也是如此复杂且难以维护(不易读取)。此外,它也可能导致性能问题。因此我决定为此编写一个方法(函数)。您也可以根据需要轻松添加任何特殊情况。我用C#编写了它,但我认为你可以将这个算法转换成任何语言:
class IPv6Validator
{
string charValidator = @"[A-Fa-f0-9]";
string IPv4Validation = @"^((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)$";
public bool IsIPv6(string maybeIPv6)
{
if (maybeIPv6 == "::")
{
return true;
}
int numberOfEmptyDigitGroups = 0;
int expectedDigitGroupsLength = 8;
string[] arrMaybeIPv6 = maybeIPv6.Split(':');
if (arrMaybeIPv6.Length > 9 || arrMaybeIPv6.Length < 3)
{
return false;
}
for (int i = 0; i < arrMaybeIPv6.Length; i++)
{
//IF IPv6 starts or ends with "::" (ex ::1)
if ((i == 0 || i == arrMaybeIPv6.Length - 2) && IsEmptyDigitGroup(arrMaybeIPv6[i]) && IsEmptyDigitGroup(arrMaybeIPv6[i+1]))
{
expectedDigitGroupsLength = 9;
numberOfEmptyDigitGroups++;
i++;
}
else if (arrMaybeIPv6[i].Trim() == string.Empty) //If IPv6 contains :: (ex 1:2::3)
{
numberOfEmptyDigitGroups++;
}
//Cannot have more than one "::" (ex ::1:2::3)
if (numberOfEmptyDigitGroups > 1)
{
return false;
}
//Mapped IPv4 control
if (i == arrMaybeIPv6.Length - 1 && IsIPv4(arrMaybeIPv6[i]) && arrMaybeIPv6.Length < 8)
{
return true;
}
else if (i == arrMaybeIPv6.Length - 1 && HasSpecialCharInIPv6(arrMaybeIPv6[i], IsEmptyDigitGroup(arrMaybeIPv6[i - 1]))) //If last digit group contains special char (ex fe80::3%eth0)
{
return true;
}
else //if not IPV4, check the digits
{
//Cannot have more than 4 digits (ex 12345:1::)
if (arrMaybeIPv6[i].Length > 4)
{
return false;
}
//Check if it has unvalid char
foreach (char ch in arrMaybeIPv6[i])
{
if (!IsIPv6Char(ch.ToString()))
{
return false;
}
}
}
//Checks if it has extra digit (ex 1:2:3:4:5:6:7:8f:)
if (i >= expectedDigitGroupsLength)
{
return false;
}
//If it has missing digit at last or end (ex 1:2:3:4:5:6:7:)
if ((i == 0 || i == arrMaybeIPv6.Length - 1) && IsEmptyDigitGroup(arrMaybeIPv6[i]) && expectedDigitGroupsLength != 9)
{
return false;
}
//If it has missing digits (ex 1:2:3:4:5:6)
if (i == arrMaybeIPv6.Length - 1 && numberOfEmptyDigitGroups == 0 && arrMaybeIPv6.Length < 8)
{
return false;
}
}
return true;
}
bool IsIPv4(string lastDigitGroup)
{
//If lastDigitGroup has special char, then get the first group for IPV4 validation (ex ::123.12.2.1/60)
string maybeIPv4 = lastDigitGroup.Split('/','%')[0];
Match match = Regex.Match(maybeIPv4, IPv4Validation);
return match.Success;
}
bool IsIPv6Char(string strChar)
{
Match match = Regex.Match(strChar, charValidator);
return match.Success;
}
bool IsSpecialChar(char ch)
{
if (ch == '%' || ch == '/')
{
return true;
}
return false;
}
bool HasSpecialCharInIPv6(string lastDigitGroup, bool isPreviousDigitGroupEmpty)
{
for (int i = 0; i < lastDigitGroup.Length; i++)
{
//If cannot find any special char at first 5 chars then leave the for loop
if (i == 5)
break;
//If the first digit is special char, check the previous digits to be sure it is a valid IPv6 (ex FE80::/10)
if (i == 0 && IsSpecialChar(lastDigitGroup[i]) && isPreviousDigitGroupEmpty)
return true;
if (i != 0 && IsSpecialChar(lastDigitGroup[i]))
return true;
if (!IsIPv6Char(lastDigitGroup[i].ToString()))
return false;
}
return false;
}
bool IsEmptyDigitGroup(string digitGroup)
{
if (digitGroup.Trim() == string.Empty)
return true;
return false;
}
}
我还添加了其他方法,例如如何在文本或文件中搜索IPv6。您可以查看:Regular expression that matches valid IPv6 addresses
编辑摘要:Ipv4映射和特殊字符已被覆盖,如&#34; :: 123.23.23.23&#34;,&#34; fe80 :: 3%eth0&#34;, &#34; :: FFFF:192.1.56.10/96"
答案 1 :(得分:1)
::
是一个有效的IPv6地址(全零地址),为什么不接受呢?
如果您不想接受使用IPv4表示法写入的最后32位的IPv6地址(为什么不是,它们是有效的地址表示),那么只需撤销处理它们的正则表达式的最后部分(从::(ffff
开始。
无论如何,正则表达式确实在IPv4表示法部分中包含一些错误。 IPv4表示法只是写入IPv6地址的最后32位的一种不同方式,并且正则表达式不处理该地址的所有有效变体。此外,它甚至会忘记转义.
,因此它也会接受许多无效的字符串。
答案 2 :(得分:0)
在@nhahtdh的回答 https://stackoverflow.com/a/21943960/3112803 的帮助下,我发现将其分解为最佳解决方案。以下是如何在PL/SQL
中执行此操作的示例,但可以通过其他语言的方式完成此操作。我会在ColdFusion
中做同样的事情。对于PL/SQL
,模式需要保持在512个字符以下,因此将其分解效果很好并且很容易理解。它在原始问题中通过了我的所有测试用例。
if (
/* IPv6 expanded */
REGEXP_LIKE(v, '\A[[:xdigit:]]{1,4}(:[[:xdigit:]]{1,4}){7}\z')
/* IPv6 shorthand */
OR (NOT REGEXP_LIKE(v, '\A(.*?[[:xdigit:]](:|\z)){8}')
AND REGEXP_LIKE(v, '\A([[:xdigit:]]{1,4}(:[[:xdigit:]]{1,4}){0,6})?::([[:xdigit:]]{1,4}(:[[:xdigit:]]{1,4}){0,6})?\z'))
/* IPv6 dotted-quad notation, expanded */
OR REGEXP_LIKE(v, '\A[[:xdigit:]]{1,4}(:[[:xdigit:]]{1,4}){5}:(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])){3}\z')
/* IPv6 dotted-quad notation, shorthand */
OR (NOT REGEXP_LIKE(v, '\A(.*?[[:xdigit:]]:){6}')
AND REGEXP_LIKE(v, '\A([[:xdigit:]]{1,4}(:[[:xdigit:]]{1,4}){0,4})?::([[:xdigit:]]{1,4}:){0,5}(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])){3}\z'))
) then