字符串对于.join而言太长时的变通方法。发生溢出错误

时间:2009-08-02 20:13:53

标签: python overflow

我正在解决pythonchallenge.com上的一些python问题来教自己python而且我遇到了障碍,因为我要使用的字符串太大而无法处理python。我收到此错误:

my-macbook:python owner1$ python singleoccurrence.py
Traceback (most recent call last):
  File "singleoccurrence.py", line 32, in <module>
    myString = myString.join(line)
OverflowError: join() result is too long for a Python string

我对此问题有哪些替代方案?我的代码看起来像......

#open file testdata.txt
#for each character, check if already exists in array of checked characters
#if so, skip.
#if not, character.count
#if count > 1, repeat recursively with first character stripped off of page.
# if count = 1, add to valid character array.
#when string = 0, print valid character array.

valid = []
checked = []
myString = ""

def recursiveCount(bigString):
    if len(bigString) == 0:
        print "YAY!"
        return valid
    myChar = bigString[0]
    if myChar in checked:
        return recursiveCount(bigString[1:])
    if bigString.count(myChar) > 1:
        checked.append(myChar)
        return recursiveCount(bigString[1:])
    checked.append(myChar)
    valid.append(myChar)
    return recursiveCount(bigString[1:])

fileIN = open("testdata.txt", "r")
line = fileIN.readline()

while line:
    line = line.strip()
    myString = myString.join(line)
    line = fileIN.readline()

myString = recursiveCount(myString)
print "\n"
print myString

1 个答案:

答案 0 :(得分:10)

string.join没有按你的想法行事。 join用于将单词列表与给定的分隔符组合成单个字符串。即:

>>> ",".join(('foo', 'bar', 'baz'))
'foo,bar,baz'

您发布的代码段将尝试在变量行中的每个字符之间插入myString。你可以看到它会如何迅速变大:-)。您是否尝试将整个文件读入单个字符串myString?如果是这样,你想要连接字符串的方式是这样的:

myString = myString + line

虽然我在这里......因为你在学习Python这里有一些其他的建议。

有更简单的方法可以将整个文件读入变量。例如:

fileIN = open("testdata.txt", "r")
myString = fileIN.read()

(这不会有你现有的strip()代码的确切行为,但事实上可能会做你想要的。)

另外,我绝不会推荐实用的Python代码使用递归来迭代字符串。您的代码将为字符串中的每个字符进行函数调用(和堆栈条目)。另外我不确定Python是否会非常聪明地使用bigString [1:]:它可能会在内存中创建第二个字符串,它是没有第一个字符的原始副本。处理字符串中每个字符的最简单方法是:

for mychar in bigString:
    ... do your stuff ...

最后,您使用名为“checked”的列表来查看您之前是否曾见过某个特定字符。但是对列表的成员资格测试(“如果myChar in checked”)很慢。在Python中,你最好使用字典:

checked = {}
...
if not checked.has_key(myChar):
    checked[myChar] = True
    ...

你正在做的这个练习是学习几个Python习语的好方法。