在数据框上实施的高效应用功能

时间:2019-07-19 13:53:47

标签: python pandas

我在数据框中创建了所有评论的极性得分。我正在为此使用vader库。我正在将lamda函数应用于数据框以创建极性分数。我的数据框很大,代码花费了太多时间。我也尝试编写函数并将其应用,但仍然太费时间。帮助我提高代码效率。

我尝试将lambda函数与apply一起使用,我通过它编写了一个函数循环以应用于每行。没有任何作用。

start= time.time()
df =data_temp['reviews_list'].apply(lambda x :pd.DataFrame(analyser.polarity_scores(x),index=[0]))
end = time.time()
print(end-start)

对于最初的100条记录,耗时29秒。我需要一个快速解决方案 也尝试过

def func(x):
    return(analyser.polarity_scores(x))
df =data_temp['reviews_list'].apply(lambda x :pd.DataFrame(func(x),index=[0]))

输出应采用数据框的形式,以后我可以将其连接到原始数据框

0 个答案:

没有答案