Google Datalab)如何通过pandas read_csv()读取Google云端存储中存在的多个csv文件?

时间:2017-08-06 14:05:08

标签: google-cloud-platform google-cloud-storage google-cloud-datalab

我找到了解读"单身" Datalab中的csv文件:How can i load my csv from google dataLab to a pandas data frame?

但我想知道我怎么能阅读"多个" Datalab中的csv文件。

我尝试的是这样的:

variable_list = ['IBM', 'SPY']
for variable in variable_list:
  file_path = "gs://chois-trader-bucket/data/" + variable + ".csv"
  %%storage read --object file_path --variable variable

但是这个失败了,因为python变量与magic命令不兼容。

如何有效处理多个csv文件?

2 个答案:

答案 0 :(得分:1)

您可以使用大括号中的 变量

e.g) %storage read --object {file_path} --variable variable

答案 1 :(得分:0)

或者,您可以使用bash中的单行代码对文件夹中的所有csv文件进行联合(假设csv文件中没有标题):

cat *.csv > unioned_file_name.csv

然后将该文件导入pandas。