我有一个正则表达式来检查字符串是否包含IP地址。
无论如何,我是否需要检查并剥离所有端口号/ ipv6详细信息-所以我只剩下IP地址:
117.89.65.117.ipv6.la
应该成为117.89.65.117
121.58.242.206:449
应该成为121.58.242.206
这是我到目前为止要检查的代码-有人可以帮助我修改它以去除上面的额外信息吗?
private void AddToList(String IP)
{
Regex ipAddress = new Regex(@"\b\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}\b");
Match result = ipAddress.Match(IP);
if (chkQuotes.Checked) IP = "\"" + IP + "\"";
if (result.Success)
if (cIPlist.IndexOf(IP) <= 0)
cIPlist.Add(IP);
}
答案 0 :(得分:1)
首先,我们可以使用https://www.regular-expressions.info/ip.html修复正则表达式并将其减少一点。使用(){3}
。
然后要消除重复,可以使用不允许使用的HashSet<string>
。
为了添加“简单”一行linQ并进行测试,我将AddToList
的参数切换为params string[]
。
static HashSet<string> resultingList = new HashSet<string>();
static string pattern = @"(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}(25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9]?[0-9]";
static Regex ipRegex = new Regex(pattern);
static void AddToList(params string[] ips) =>
resultingList.UnionWith(
ips.Select(x => ipRegex.Match(x))
.Where(x => x.Success)
.Select(x => x.Value)
);
private static void TestMethod()
{
var inputs = new[]{
"123.123.123.13:256",
"123.123.123.13:256", //duplicate line
"17.89.65.117.ipv6.la ",
"21.58.242.206:449",
"666.666.666.666"
};
AddToList(inputs);
AddToList("127.0.0.1");
}
答案 1 :(得分:1)
您可以使用result.Value
访问整个匹配值,而不用重新使用IP
变量。
此外,在方法内部使用正则表达式以加快处理速度之前,最好定义正则表达式。
private static HashSet<string> cIPlist = new HashSet<string>();
private static readonly Regex ipAddress = new Regex(@"\b\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}\b");
private void AddToList(String IP)
{
var result = ipAddress.Match(IP);
if (result.Success) # Check if there is a match
{
if (chkQuotes.Checked) # If the checkbox is checked
{
IP = $"\"{result.Value}\""; # Add quotes around the match value
}
cIPlist.Add(IP); # Add to hashset of strings
}
}
请参见C# demo。
请注意,如果要限制正则表达式模式仅匹配IP而不匹配999.999.999.999
之类的字符串,则可以使用regular-expressions.info中众所周知的模式:
new Regex(@"\b(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)(?:\.(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)){3}\b")