从文件夹将* random * CSV文件导入到熊猫

时间:2020-03-05 20:51:04

标签: pandas data-science data-analysis

我有一个包含多个csv文件的文件夹,文件名在100到400之间(例如142.csv,278.csv等)。并非100-400之间的所有数字都与文件相关联,例如,没有143.csv。我想编写一个循环,将5个随机文件导入大熊猫中的单独数据帧中,而不是一遍又一遍地手动搜索和输入文件名。有什么想法可以帮助我开始吗?

1 个答案:

答案 0 :(得分:0)

您可以使用glob并读取目录中的所有csv文件。

file = glob.glob('*.csv')
random_files=np.random.choice(file,5)
dataframes= []
for fp in random_files :
    dataframes.append(pd.read_csv(fp))

从中,您可以从目录中选择5个随机文件,然后分别读取它们。 希望我回答你的问题