搜索IP范围-算法/数据结构?

时间:2019-02-14 09:35:12

标签: c# algorithm

假设我有一个IPRange对象,定义如下:

public class IPRange {
    public IPAddress Start { get; set; }
    public IPAddress End { get; set; }
    public string Description { get; set; }
    public DateTime ExpireDate { get; set; }
}

然后我有一个IPRange[]的对象,其中有数百个或数千个条目,这些条目具有范围开始/结束的所有不同(合理)值。

var myArray = new IPRange[...];

现在;如果我有IPAddress,那么确定它是否在任何范围内的最快方法是什么?假设:

  • 该阵列将专门包含与我们要匹配的IP相同的AddressFamily(IPv4 / IPv6)的项目
  • 范围可能可能不“重叠”
  • 一个IPRangeComparer(实现IComparer<IPRange>,首先按范围开始排序,然后(在同一开始之内)按范围结束)和IPRangeEqualityComparer(实现IEqualityComparer<IPRange>,对于IPAddressComparer(实现IComparer<IPAddress>(将IP视为字节数组,按数值对它们进行排序)进行处理),ExpireDate也可以返回相同的范围开始和范围结束的true。

为了使事情更糟一点,IPRange还具有DateTimeIPRange[])属性。 IPRange[]中的条目可能随时过期;因此我们还需要考虑到这一点。 <span以设定的时间间隔(例如每小时一次)被“重新加载”,因此定期从阵列中“清除”过期的项目。但从技术上讲,范围可能已过期,但仍在阵列中以进行下一次重新加载。我认为这并不是一个很大的问题,但是当我第一次尝试解决这个问题时确实增加了一点复杂性。

我可以简单地遍历提供O(n)性能的项目,但是我希望它的性能(好得多)。我最初从二进制搜索实现开始,以快速定位数组中的范围,但是一旦找到一个范围,数组中可能就存在着更多的左/右范围,这便使我再次从那里得到O(n)(可能更糟) ,具体取决于我们从那里走的路。

我想知道什么算法或数据结构(如果有)在这方面会有所帮助。您可能会说我正在尝试实施白名单(或黑名单,无论如何),并且需要快速分辨出该列表中是否包含IP。找到匹配范围后,便无需再寻找了。我不介意每个间隔都“(重新)构建”数据结构。我可以在后台任务中执行此操作,这样可能会花费一些时间而不必担心。

在我的查看列表中,没有特定顺序的是:B树,R(*)树,希尔伯特R树,增强间隔树和this question I just found似乎有一些有趣的信息

1 个答案:

答案 0 :(得分:0)

该解决方案是针对算法问题的算法解决方案,我不知道如何在C#中很好地编程,并且解释也不是关于IP的。

主要思想-创建一个由“子范围”组成的数组(不是真正的术语-稍后将进行解释),该数组中的每个元素都将包含指向实际范围的指针。
如果您具有范围(1,5), (3,7),则“子范围”将为(1,3), (3,5), (5,7)。并且每个新范围都将具有指向实际范围的指针-(1,3) -> (1,5)(3,5) -> (1,5), (3,7)(5,7) -> (3,7)

按开始时间对范围进行排序后,您可以在范围内一次迭代创建此数组,并具有一个帮助器数组,该数组可以保留所有仍然有效的范围。

创建此结构后,您可以搜索数字并查看其所在的“子范围”。可以在子范围的起点(即以下子范围的终点)上使用二进制搜索进行操作)。

让我们分析一些复杂性。每个范围只能将其他范围拆分两次,因此数组的大小为n,但每个元素也可以容纳n指针,因此大小为O(n^2)(也许可以更小如果您以摊销的方式对此进行分析)。大小为O(n^2)
由于最终结构将位于O(n^2)中,因此构建时间也为O(n^2)。但是搜索时间-重要的是,将在O(log n)中。