目前还不清楚文件中给予foreachpartition的lambda究竟在哪里运行驱动程序或工作者?
答案 0 :(得分:1)
与foreach()
foreachPartition()
相同的是对工人执行。没有理由将数据传输到驱动程序来处理它。
rdd.foreachPartition { rddpartition =>
val thinUrl = "some jdbc url"
val conn = DriverManager.getConnection(thinUrl)
rddpartition.foreach { record =>
conn.createStatement().execute("some statement" )
}
conn.commit()
}