循环检索pandas.core.series.Series中的情感分析

时间:2019-02-08 08:53:20

标签: python sentiment-analysis textblob

我想从中提取47条新闻文章。它们是JSON格式(日期,文章的标题和正文)。我想要的只是使用TextBlob获取带有情感的列表。到目前为止,我正在执行以下操作:

import json
import pandas
from textblob import TextBlob

appended_data = []

for i in range(1,47):
    df0 = pandas.DataFrame([json.loads(l) for l in open('News_%d.json' % i)])
    appended_data.append(df0)


appended_data = pandas.concat(appended_data)

doc_set = appended_data.body
docs_TextBlob = TextBlob(doc_set)


for i in docs_TextBlob:
    print(docs_TextBlob.sentiment)

不好意思,我收到以下错误消息:TypeError: The text argument passed to __init__(text) must be a string, not <class 'pandas.core.series.Series'>关于如何使用情感量度创建列表的任何想法吗?

1 个答案:

答案 0 :(得分:1)

要在DataFrame中创建带有情感的新列:

appended_data['sentiment'] = appended_data.body.apply(lambda body: TextBlob(body).sentiment)