将即将出现的非null值替换为pyspark中的null或空值

时间:2018-07-17 16:09:08

标签: python hadoop pyspark rdd user-defined-functions

假设您在其中一列中具有空值或空值的数据框,请替换为具有新值的数据框。我们如何实现呢?

输入数据框:

| col1 |
+------+
|  1   |
|  2   |
| null |
| null |
|  3   |
|  4   |
| null |
|      |
|  5   |
+------+

输出数据框:

| col1 |
+------+
|  1   |
|  2   |
|  3   |
|  3   |
|  3   |
|  4   |
|  5   |
|  5   |
|  5   |
+------+

预先感谢

0 个答案:

没有答案