我正在尝试像这样在python(在Linux中)附加数组:
from nltk import word_tokenize
data = []
for file_name in file_list:
with open(file_name, 'r', encoding="utf-8") as file:
data = data.append(word_tokenize(file.read()))
我的file_list有2万个文件,每个文件约有5k个字,并且在任何时候,python进程都会中止并显示以下消息:
Segmantation Fault
我该如何解决?
答案 0 :(得分:0)
如果这是要触发的完整代码,则可能是内存问题。
什么是操作系统,Python版本(包括32位还是64位)以及计算机中的可用RAM?在发生错误之前,它可以处理多少个文件,并且始终会在准确的(或相似的)时间上出错?