Python / Pandas - 如果文件位于第二个数据框中,则循环通过将文件附加到数据框的文件夹

时间:2017-11-10 16:12:31

标签: python excel pandas

我很难做一些看似简单的事情:

第一部分 创建一个空数据框来存储我的数据

第二部分 我正在使用python迭代文件夹,并查找宏启用excel文件

第III部分 这是我遇到困难的地方 - 理想情况下,我想看看'i'是否在数据框“file_df”的列“File_Name”中,然后将其附加到FileList数据框。注意:file_df数据框中的这一列只是我实际想要从文件夹中使用的文件列表。

   import pandas as pd
   import glob 
   import os

   #Part I
   FileList = pd.DataFrame(index=file_df.index, columns=['File_Name'])

   # Part II
   os.chdir(path)
   for i in glob.glob('*.xlsm'): # gives list of files from the folder

   # Part III
   if file_df[file_df['File_Name'].str.contains(i)]:
        FileList.append(i)

1 个答案:

答案 0 :(得分:0)

我可能会做这样的事情

import pandas as pd
import os
str1 = "i"
fileList=[]
for subdir, dirs, files in os.walk(path): # iterating over the files and sub folders
    for file in files:
        if file.endswith(("*.xlsm")):  # finding a file with pdf extension
            a = os.path.join(subdir, file)   # if we find the file we extract its path

            filename = a.rsplit('/')[-1]  # gets us filename with extension
            if str1 in filename:
            fileList.append(filename)