当嵌套在表达式中时,不支持生成器

时间:2018-05-02 01:28:48

标签: scala apache-spark nested expression

我必须做简单的删除"。"在做字数统计之前从字符串。它在两个语句中工作正常但在单个语句中写入时给出了以下错误。我做的事情比较愚蠢吗?或者它是一个改进的范围?

  
    

错误: org.apache.spark.sql.AnalysisException:当表达式嵌套在表达式中时,不支持生成器,但得到:regexp_replace(explode(split(CAST(value AS STRING) ),\ s +)),[。] *,);

  

代码:

import org.apache.spark.sql.functions._
val testString = " I am X. X Works for Y."
val testDF = Seq (testString).toDF
val testDF1 = testDF.select(regexp_replace (explode (split($"value".cast("String"), "\\s+")), "[.]*", ""))
testDF1.show

0 个答案:

没有答案