select features ('age', 'job', 'marital', 'education', 'default', 'balance', 'housing', 'loan', 'campaign', 'pdays', 'previous', 'poutcome', 'deposit') as df2
sdf.select('age','job', 'marital', 'education', 'default', 'balance',
'housing', 'loan', 'campaign', 'pdays', 'previous', 'poutcome', '
deposit').show()
我知道如何选择功能,但是由于我是pyspark的新手,所以我不了解 通过使用spark.sql删除无效的行