我在数据框中创建了所有评论的极性得分。我正在为此使用vader库。我正在将lamda函数应用于数据框以创建极性分数。我的数据框很大,代码花费了太多时间。我也尝试编写函数并将其应用,但仍然太费时间。帮助我提高代码效率。
我尝试将lambda函数与apply一起使用,我通过它编写了一个函数循环以应用于每行。没有任何作用。
start= time.time()
df =data_temp['reviews_list'].apply(lambda x :pd.DataFrame(analyser.polarity_scores(x),index=[0]))
end = time.time()
print(end-start)
对于最初的100条记录,耗时29秒。我需要一个快速解决方案 也尝试过
def func(x):
return(analyser.polarity_scores(x))
df =data_temp['reviews_list'].apply(lambda x :pd.DataFrame(func(x),index=[0]))
输出应采用数据框的形式,以后我可以将其连接到原始数据框