我必须做简单的删除"。"在做字数统计之前从字符串。它在两个语句中工作正常但在单个语句中写入时给出了以下错误。我做的事情比较愚蠢吗?或者它是一个改进的范围?
错误: org.apache.spark.sql.AnalysisException:当表达式嵌套在表达式中时,不支持生成器,但得到:regexp_replace(explode(split(CAST(value AS STRING) ),\ s +)),[。] *,);
代码:
import org.apache.spark.sql.functions._
val testString = " I am X. X Works for Y."
val testDF = Seq (testString).toDF
val testDF1 = testDF.select(regexp_replace (explode (split($"value".cast("String"), "\\s+")), "[.]*", ""))
testDF1.show