尝试使用.lower函数将pyspark数据帧单列中的转换值转换为小写以进行文本清除
import pyspark.sql.functions as f
f.lower(f.col(col("subject")).show()
获取:
SyntaxError: unexpected EOF while parsing
答案 0 :(得分:1)
show
是一种用于数据帧的方法。
让我们假设您的数据帧为df
,您可以这样做:
df.withColumn(
"subject",
F.lower(F.col("subject"))
).show()
答案 1 :(得分:1)
您的问题是一个括号,并且您只需要使用一次f.col()。
import pyspark.sql.functions as f
f.lower(f.col("subject")).show()
您需要将其分配给数据框:
import pyspark.sql.functions as f
df = df.withColumn("subject",f.lower(f.col("subject")))
df.show()