我使用pyspark
并且我有一个dstream
,如下所示,
mystream = dstream.map(lambda y: (y[0], y[1])).distict().groupByKey()
mystream.pprint()
但不幸的是,它说AttributeError: 'TransformedDStream' object has no attribute 'distict'
。为什么distict()
支持基于rdd的操作而不支持dstream? dstream中的distict()
等价物是什么?