我想将函数应用于dask数据框的每一行。
使用ddf.compute()
执行操作会给我一个错误:
AttributeError: 'Series' object has no attribute 'encode'
这是我的代码:
def polar(data):
data=scale(sid.polarity_scores(data.tweet)['compound'])
return data
t_data['sentiment'] = t_data.map_partitions(polar, meta=('sentiment', int))
使用t_data.head()
也会导致相同的错误。
答案 0 :(得分:1)
我已经找到答案了。您必须申请分区。
t_data['sentiment']=t_data.map_partitions(lambda df : df.apply(polar,axis=1))
答案 1 :(得分:0)
您可以使用以下内容:
t_data.apply(polar, axis=1)