假设我有一个IPRange
对象,定义如下:
public class IPRange {
public IPAddress Start { get; set; }
public IPAddress End { get; set; }
public string Description { get; set; }
public DateTime ExpireDate { get; set; }
}
然后我有一个IPRange[]
的对象,其中有数百个或数千个条目,这些条目具有范围开始/结束的所有不同(合理)值。
var myArray = new IPRange[...];
现在;如果我有IPAddress
,那么确定它是否在任何范围内的最快方法是什么?假设:
IPRangeComparer
(实现IComparer<IPRange>
,首先按范围开始排序,然后(在同一开始之内)按范围结束)和IPRangeEqualityComparer
(实现IEqualityComparer<IPRange>
,对于IPAddressComparer
(实现IComparer<IPAddress>
(将IP视为字节数组,按数值对它们进行排序)进行处理),ExpireDate
也可以返回相同的范围开始和范围结束的true。为了使事情更糟一点,IPRange还具有DateTime
(IPRange[]
)属性。 IPRange[]
中的条目可能随时过期;因此我们还需要考虑到这一点。 <span
以设定的时间间隔(例如每小时一次)被“重新加载”,因此定期从阵列中“清除”过期的项目。但从技术上讲,范围可能已过期,但仍在阵列中以进行下一次重新加载。我认为这并不是一个很大的问题,但是当我第一次尝试解决这个问题时确实增加了一点复杂性。
我可以简单地遍历提供O(n)性能的项目,但是我希望它的性能(好得多)。我最初从二进制搜索实现开始,以快速定位数组中的范围,但是一旦找到一个范围,数组中可能就存在着更多的左/右范围,这便使我再次从那里得到O(n)(可能更糟) ,具体取决于我们从那里走的路。
我想知道什么算法或数据结构(如果有)在这方面会有所帮助。您可能会说我正在尝试实施白名单(或黑名单,无论如何),并且需要快速分辨出该列表中是否包含IP。找到匹配范围后,便无需再寻找了。我不介意每个间隔都“(重新)构建”数据结构。我可以在后台任务中执行此操作,这样可能会花费一些时间而不必担心。
在我的查看列表中,没有特定顺序的是:B树,R(*)树,希尔伯特R树,增强间隔树和this question I just found似乎有一些有趣的信息
答案 0 :(得分:0)
该解决方案是针对算法问题的算法解决方案,我不知道如何在C#
中很好地编程,并且解释也不是关于IP
的。
主要思想-创建一个由“子范围”组成的数组(不是真正的术语-稍后将进行解释),该数组中的每个元素都将包含指向实际范围的指针。
如果您具有范围(1,5), (3,7)
,则“子范围”将为(1,3), (3,5), (5,7)
。并且每个新范围都将具有指向实际范围的指针-(1,3) -> (1,5)
,(3,5) -> (1,5), (3,7)
和(5,7) -> (3,7)
。
按开始时间对范围进行排序后,您可以在范围内一次迭代创建此数组,并具有一个帮助器数组,该数组可以保留所有仍然有效的范围。
创建此结构后,您可以搜索数字并查看其所在的“子范围”。可以在子范围的起点(即以下子范围的终点)上使用二进制搜索进行操作)。
让我们分析一些复杂性。每个范围只能将其他范围拆分两次,因此数组的大小为n
,但每个元素也可以容纳n
指针,因此大小为O(n^2)
(也许可以更小如果您以摊销的方式对此进行分析)。大小为O(n^2)
。
由于最终结构将位于O(n^2)
中,因此构建时间也为O(n^2)
。但是搜索时间-重要的是,将在O(log n)
中。