Question

我想将函数应用于dask数据框的每一行。

使用ddf.compute()执行操作会给我一个错误：

AttributeError: 'Series' object has no attribute 'encode'

这是我的代码：

def polar(data):
    data=scale(sid.polarity_scores(data.tweet)['compound'])
    return data

t_data['sentiment'] = t_data.map_partitions(polar, meta=('sentiment', int))

使用t_data.head()也会导致相同的错误。

Answer 1

我已经找到答案了。您必须申请分区。

t_data['sentiment']=t_data.map_partitions(lambda df : df.apply(polar,axis=1))

Answer 2

您可以使用以下内容：

t_data.apply(polar, axis=1)

达标计算给出AttributeError：“系列”对象没有属性“编码”

2 个答案: