基于列值(1,0)更新Spark数据框中的当前记录值

时间:2019-05-13 21:48:26

标签: scala apache-spark

我有一个包含300列的数据框,并且有一列display(HTML('''<center><img src ="image/image1.png" style="height:150px;width:340px" /></center>''')) 的值可以为boolean(1或0)。

如果value为1,则保持记录值不变。

如果check_field的值为0,则将先前的记录值复制到当前记录。

输入

                   
    check_field                 
    1   500 400 300 200 100
    1   34  67  89  654 123
    0   10  20  56  123 66
    0   2   5   56  56  78
    1   100 50  40  30  10
    0   667 786 687 989 311
    1   432 54  1314    676 76
    

输出
    

    1   500 400 300 200 100
    1   34  67  89  654 123
    0   34  67  89  654 123
    0   34  67  89  654 123
    1   100 50  40  30  10
    0   100 50  40  30  10
    1   432 54  1314    676 76

0 个答案:

没有答案