我想要查看一些文件,我想根据一组变量标记每个文件,例如......
location = 'home'
source_system = 'Sys_'
date = '20160608'
file_name = location+source_system+date
print(file_name)
-> homeSys_20160608
...基于file_name我想用它来标记数据帧,所以像......
file_name = sqlContext.read.parquet(file_path)
我在其他地方定义了file_path。
当我尝试这种情况时会发生什么现在,数据帧现在被命名为file_path而不是homeSys_20160608,这是变量最初的原因。
有没有办法做我想做的事?
基本上我想知道是否有办法根据变量创建数据框。我想创建多个数据框,每个数据框具有不同的名称,以便我可以在一个python笔记本中分析它们。每个数据框都具有相同的结构,但填充了不同的数据。
答案 0 :(得分:0)
您正在加入' location + source_system + date'没有任何文件系统分隔符。
您的字符串将如下所示:homeSys_20160608
你希望它成为这样,我相信:home/Sys_20160608
你可以像这样手动输入一个:
file_name = location + '/' + source_system + date
或使用os
模块:
file_name = location + os.path.sep + source_system + date
以便它可以在Windows和Linux上运行。