用熊猫导入多个数据框

时间:2018-10-16 18:23:42

标签: python pandas dataframe

我正在尝试通过一个函数将多个数据集导入单个数据框中。

# function to import each of the new datasets 
def csvImport(yearOfDataset):
import glob, os
for items in yearOfDataset:
    # dataset name 
    ds = pd.concat(map(pd.read_csv, glob.glob(os.path.join("PSNI_StreetCrime_"+str(yearOfDataset)),"*.csv")))

我想按以下方式将参数传递给函数,因为这意味着我可以为拥有的多个文件夹更快地调用它;文件夹名称遵循模式ChildFolder_YYYY

csvImport('2014')

运行上述命令时,这些都是返回的错误。

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-61-bba2086ac576> in <module>()
----> 1 csvImport('2014')

<ipython-input-56-0459a8272784> in csvImport(yearOfDataset)
  2 def csvImport(yearOfDataset):
  3     import glob, os
----> 4     sd = pd.concat(map(pd.read_csv, glob.glob(os.path.join("Datasets/PSNI_StreetCrime_"+yearOfDataset),"*.csv")))

TypeError: glob() takes 1 positional argument but 2 were given

我是Pandas的新手,而Python是半新手,所以非常感谢您的帮助,我尝试过的各种更改均未成功。

0 个答案:

没有答案