在python 3.6.0中将字符串插入Dataframe

时间:2017-07-27 09:37:12

标签: python python-3.6

我想从网络文件夹中找到所有.gz文件的文件夹路径。 我的script低于error但<{1}}:

TypeError: cannot concatenate a non-NDFrame object

请提供同样的帮助

脚本:

import os
import pandas as pd

adcPath = r'\\ADC\redshift-datasets\BLSCEWAG2016'

gzPath = pd.DataFrame(columns=['Path'], dtype=object)
for path, subdirs, files in os.walk(adcPath):
for name in files:
if name.endswith('.gz'):
gzPath = gzPath.append(path) # Want to insert to dataframe gzPath to export in csv

gzPath = gzPath['Path'].unique()
exportPath = r'D:\Sunil_Work\temp8' + '\\Path.csv'
gzPath.to_csv(exportPath)

1 个答案:

答案 0 :(得分:1)

您可以使用glob模块中的outfile:write函数获取所有glob个文件:

.gz

然后,创建数据框并调用import glob files = glob.glob(r'\\ADC\redshift-datasets\BLSCEWAG2016\**\*.gz', recursive=True)

df.unique

保存到csv:

gzPath = pd.DataFrame(files, columns=['Path'], dtype=object)['Path'].unique()