我大约有70个.txt文件都保存为
1.txt, 2.txt
,依此类推。我想创建一个仅包含fileContent
之类的数据框,并且每一行中的每个txt文件都包含文本。每次我尝试使用数字数组中的名称上传文件时,都会出现错误。
可以实现吗?
重要的是我的数组是 [1,2,3,........70]
而不是[1.txt, 2.txt.....70.txt]
答案 0 :(得分:3)
import pandas as pd
import os
txt_files = [f for f in os.listdir('path_of_txt_files') if '.txt' in f]
pd.DataFrame(pd.Series(dict(zip(txt_files,[open(f,'r').read() for f in txt_files]))))
这将创建一个表,其中一列包含文件名,另一列包含它们各自的内容。