我正在编写一个处理数千个文件的Python代码,将每个文件的数据放在一个数据框中,每个数据框都附加在一个数组中。然后,它接受这个数组并连接它,以便最终结果是一个包含所有数据帧的所有数据的矩阵。
以下是代码说明:
for root, dirs, filenames in os.walk(folder_name):
for f in filenames:
if f == '.DS_Store':
continue
fullpath = os.path.join(folder_name, f)
book = open(fullpath, 'r')
data = {u[0]:u[1] for u in json.load(book)}
books.append(pd.DataFrame(data=[data], index=[f]))
df = pd.concat(books, axis=0).fillna(0).sort_index()
M = df.as_matrix()
我在处理部分没有遇到任何问题; for循环完美无缺。但是,当我尝试连接时,代码会持续运行20分钟左右,然后脚本会以“退出代码-9”停止。知道这可能意味着什么和/或如何解决这个问题?
任何建议都将非常感谢!