在Python中管理长字符串(超过10万个字符)

时间:2018-12-16 11:01:47

标签: python

我正在处理Python(www.pythonchallenge.com/)中的一些挑战,我需要在相当长的看似随机字符的字符串中找到字符序列。

我已经解决了大多数问题(即提供了一个函数来提取我要查找的序列),但是我不能将其应用于字符串,因为它太长了(超过10万个字符) )。

我尝试用经典的普通字符串输入它:

string = "I'm a lumberjack and I'm OK I sleep all night and I work all day, He's a lumberjack and he's OK, He sleeps all night and he works all day etc etc"

Jupyter Lab不喜欢那一点。输入的单元格刚刚开始工作,但似乎没有结束。

有趣的是,我检查了内存/处理器,一切似乎都很好。

关于如何处理此问题的任何想法?

提前谢谢!

1 个答案:

答案 0 :(得分:0)

感谢大家的建议!

为了记录,似乎在Jupyter中声明字符串的方式似乎是一个限制。一个简单的file.read()函数被证明效率更高。

file = open("string.txt", "r")
string = file.read()

非常感谢