熊猫的元组数据框架?

时间:2017-07-07 21:08:27

标签: python pandas apache-spark pyspark

我有一个pandas数据框,我是通过调用列表(从spark rdd创建)创建的:

router.navigate(['/', {outlets: {sidebar: null, primary: ["/contacts", {field: value}]}}]" 然后newRdd = rdd.map(lambda row: Row(row.__fields__ + ["tag"])(row + (tagScripts(row), ))).collect()

我的数据最终看起来像元组的数据框,如下所示:

df = pd.DataFrame(newRdd)

但是我需要它看起来像带有列标题的标准表:

0  (2017-06-21, Sun, ATL, 10)
1  (2017-06-21, Sun, ATL, 11)
2  (2017-06-21, Sun, ATL, 11)

我老实说这个想法并且需要一些帮助。我尝试了很多不同的事情,似乎没有任何工作。任何帮助将不胜感激。谢谢你的时间。

1 个答案:

答案 0 :(得分:2)

你可以这样做:

df = pd.DataFrame([*df.A],columns = ['date','dayOfWeek','airport','val1','val2','val3','val4','val5','val6'])

我认为您已经拥有的数据框中的列名是A

您可以检查here是否有解包的元组。

希望这有用。如有任何问题,请告诉我。