我正在使用PySpark在我的数据框中创建一个附加的BinaryColumn,然后使用它来过滤该数据框。此过程显示错误。
Click here to see the Binary Column
答案 0 :(得分:0)
尝试使用filter
函数
df_filter = df_bc.filter(col('binary_col') == 'false')
df_filter.show()
答案 1 :(得分:0)
您要将binary_col
添加到 df_bc
数据帧中,而不是添加到df_
中。
尝试从df_bc
数据帧访问binary_col,
df_filter=df_bc.where(df_bc.binary_col)
df_filter.show()