对数据集使用相同名称是否会影响性能

时间:2018-01-25 03:21:56

标签: performance pyspark

这两段代码之间是否有任何差异,性能方面:

df = //read the file here df = df.select(//some columns here) df = df.groupBy().agg() // some operation df = df.filter() //some filtering df.show()

df = //read the file here df1 = df.select(//some columns here) df2 = df1.groupBy().agg() // some operation df3 = df2.filter() //some filtering df3.show()

0 个答案:

没有答案