为什么子串切片索引超出范围在Python中有效?

时间:2012-02-28 21:31:27

标签: python string substring

为什么'example'[999:9999]没有导致错误?自'example'[9]以来,它背后的动机是什么?

根据这种行为,我可以假设'example'[3]在本质上/内部与'example'[3:4]不同,即使两者都产生相同的'm'字符串。

3 个答案:

答案 0 :(得分:47)

你是对的! 'example'[3:4]'example'[3]从根本上是不同的,并且在序列的边界之外切片(至少对于内置函数)不会导致错误。

一开始可能会令人惊讶,但是当你想到它时它会有意义。索引返回单个项目,但切片返回项目的子序列。因此,当您尝试索引不存在的值时,无法返回任何内容。但是当你将一个序列切割到边界之外时,你仍然可以返回一个空序列。

这里令人困惑的部分原因是字符串与列表的行为略有不同。看看当你对列表做同样的事情会发生什么:

>>> [0, 1, 2, 3, 4, 5][3]
3
>>> [0, 1, 2, 3, 4, 5][3:4]
[3]

这里的区别是显而易见的。在字符串的情况下,结果看起来是相同的,因为在Python中,字符串之外没有单个字符。单个字符只是一个1个字符的字符串。

(有关在序列范围之外切片的确切语义,请参阅mgilson's answer。)

答案 1 :(得分:19)

为了添加指向documentation中的健壮部分的答案:

给出像s[i:j:k]

这样的切片表达式
  

具有步骤k的从i到j的s的片被定义为具有索引x = i + n * k的项的序列,使得0 <= n <1。 (J-I)/ K。换句话说,索引是i,i + k,i + 2 * k,i + 3 * k等等,当到达j时停止(但是从不包括j)。 当k为正数时,如果它们更大则i和j减少为len(s)

如果你写s[999:9999],python从s[len(s):len(s)]返回len(s) < 999,你的步骤是肯定的(1 - 默认值)。

答案 2 :(得分:5)

切片不受内置类型的限制。虽然你的两个例子似乎都有相同的结果,但它们的工作方式不同;用一个列表来尝试它们。