有关“数据结构和算法”书中的代码的问题

时间:2018-11-01 09:08:51

标签: python python-3.x algorithm big-o

我一直在用书刷新我对数据结构和算法的了解。我在书中遇到了一些示例代码,包括一些似乎无法理解的运行时分析值。我不知道我是否想得太多,还是想念一些非常简单的东西。请帮帮我。

  1. 在这种情况下,他们解释了在列表中的特定索引处添加元素的背后逻辑。我明白了,这很简单。移动所有元素,从最右边的一个开始,向右移动一个索引,以在该索引处为该元素腾出空间。本书中的代码如下:

    for j in range(self._n, k, −1): self._A[j] = self._A[j−1]

    我没有得到的是循环范围。从技术上讲,self._n等效于len(list)(列表维护的内部状态)。而且,如果您从len(list)开始,那么您将立即处于IndexOutOfBoundError。其次,即使那不是真的,循环也会将n替换为n-1。实际上,实际上没有任何地方先将n移至n+1,从而丢失了该值。我在这里想念什么吗?实际上,我在Python解释器上尝试了这些条件,它们似乎验证了我的理解。

  2. 一些针对列表操作的运行时分析似乎使我感到困惑。例如: data.index(value) --> O(k+1) value in data --> O(k+1) data1 == data2 (similarly !=, <, <=, >, >=) --> O(k+1) data[j:k] --> O(k−j+1)

    在每次运行时间分析结束时,我不明白为什么+1。让我们考虑data.index(value)操作,该操作基本上返回找到特定值的第一个索引。在最坏的情况下,它应该遍历列表中的所有n元素,但如果没有,则如果搜索在索引k处找到某些内容,则它将从那里返回。为什么O(k+1)在那儿?相同的逻辑也适用于其他情况,尤其是列表切片。切片列表时,它不只是O(k-j)吗?相反,实际索引为jk-1

这种理解应该是非常基础的,我真的很傻,无法理解它。或者我不知道书中是否有真正的勘误,并且我理解正确。有人可以帮我澄清一下吗?非常感谢您的帮助。

2 个答案:

答案 0 :(得分:2)

请注意(摘自评论):相关书籍为Data Structures and Algorithms in Python by Goodrich, Tamassia and Goldwasser,相关问题与第202至204页有关。

如果您真正看过本书中insert的整个定义,那就更有意义了。

def insert(self, k, value):
    if self.n == self.capacity:
        self.resize(2 * self.capacity)

    for j in range(self.n, k, −1):
        self.A[j] = self.A[j−1]

    self.A[k] = value
    self.n += 1

第一行表示self.n是元素的数目,并且对应于索引的末尾,这意味着对于列表的用户,在该索引处访问它是错误的。但是此代码属于列表,并且因为它除了大小外还具有容量,因此如果self.A[n]可以使用self.n < self.capacity(在for循环开始时为true)。

循环仅将最后一个元素(在索引n-1处)移动到内存中的下一个空间,这对于用户来说是超出范围的,但对于内部用户而言则不是。最后,n递增以反映新的大小,n-1成为该“下一个内存空间”的索引,该空间现在包含最后一个元素。

关于不同操作的时间复杂度:嗯,它们是不正确的。即使O(n+1) = O(n),您仍然可以根据需要编写O(n+1),在某些情况下可能更“精确”。

例如,写成data.index(value)的复杂度为O(k+1),其中k是要搜索的值的索引。好吧,如果该值是最开始的,那么k = 0和复杂度为O(0+1) = O(1)。的确是这样:如果您始终搜索一开始就知道的值,即使此操作没有意义,它也具有恒定的时间复杂度。如果您最初写的是O(k),那么您将获得上次操作的O(0),这是我从未见过的用法,但会让我认为该操作是瞬时的。

切片时也会发生同样的事情:他们可能写了O(k−j+1),因为如果只取一个元素,那么j = k的复杂度就是O(1)而不是O(0)。 / p>

请注意,时间复杂度通常不是根据函数的特定应用程序的实际索引来定义,而是根据使用该函数的容器中的元素总数来定义。您可以将其视为使用该函数与每个可能的索引的平均复杂度,在index和切片的情况下,其简单度为O(n)

答案 1 :(得分:0)

对于第一种情况,我认为假设是您具有固定最大长度的列表,并且应该丢失最后一个数据点。另外,您确定self._n == len(n)而不是self._n == len(n)-1吗?

就第二种情况而言,据我了解,O(k + 1)与O(k)相同,因此说O(k + 1)毫无意义。但是再次,如果我们真的想知道某人如何计数最多k + 1个……我想那家伙从0开始计数。因此,从0th到kth索引将需要k + 1个运算。

这只是一种意见,是一种统一的意见,所以请用一汤匙食盐食用。我认为那本书不是好人。