集成的调试pyspark数据帧有时会输出到终端而不是调试控制台

时间:2018-07-11 00:08:09

标签: pyspark visual-studio-code apache-spark-sql vscode-settings

在调试pyspark程序时,我在加载数据帧(ch)之后放置了一个断点。然后,使用调试控制台单个命令行执行以下操作:

ch.count()  
32489

计数正确显示在ch.count()下。但是,如果尝试显示数据框内容,则会得到以下信息:

ch.show()
None

即使如此,数据框的输出也正确显示在“终端”窗口中!因此,如果单击查看“终端”窗口,则会看到ch.show()的输出。 我看了其他看似相关的问题,但没有成功。例如,我尝试以下操作没有成功。

"console": "None"  

然后:

"console": "integratedTerminal"

也:

"debugOptions": ["RedirectOutput"]

谢谢

1 个答案:

答案 0 :(得分:0)

df.show在内部打印到stdout而不是stderr,如果要打印到stderr,请使用df.take并自己打印。无是df.show方法返回的结果。