我正在for循环中创建四个变量,我试图将这些变量写入pyspark的数据帧中。然后,我想将此数据帧写入镶木地板和csv文件中。有没有一种有效的方法来做到这一点。如果可以的话,请用pyspark代码向我解释。
答案 0 :(得分:1)
一种优雅而有效的方法是将
例如:
(给定四个功能f1
,f2
,f3
,f4
,接受一个int
参数并给spark
一个{{1 }}实例)
以下for循环:
SparkSession
可以翻译成:
for i in range(1000000):
v1, v2, v3, v4 = f1(i), f2(i), f3(i), f4(i)
[...]