“ groupby.apply”和“ groupby.agg”之间的区别

时间:2019-07-05 01:56:58

标签: pyspark

groupby.apply'and'groupby.agg”有什么区别? ,为什么处理后的数据显示为“ NoneType”?

  1. 这是针对Spark 2.1.0的,我想将一列变成多行,同一列可以用逗号连接,当我使用groupby.apply时,当我使用{{1}时没有输出},程序可以按照我的想法执行。
  2. 我使用了groupby.agg的过程,但显示'.count()'对象没有属性'NoneType'。
count

我想知道过程的行数和列数。

1 个答案:

答案 0 :(得分:0)

data1=df.groupBy('_c0').apply(collect_list('_c1')).show()

返回NoneType,因为show不返回任何内容。这就是为什么您不能对其应用计数。摆脱表演。 apply返回sql.DataFrame。有关您要尝试执行的操作,请参考this SO Question

请参阅show中的source code