csv文件上的Textblob情绪分析

时间:2016-02-22 16:48:37

标签: python sentiment-analysis textblob

我有一个包含大约50行句子的csv文件。我正在使用textblob情绪分析工具。为了测试句子的极性,该例子显示你写了一个句子,并显示了极性和主观性。但是,它只适用于一个句子,我希望它适用于我拥有的csv文件,因为我不能单独测试它们,因为它需要太长时间。我该怎么做呢?

TextBlob显示这个例子,当我输入一个句子时,极性显示,你不能一次输入两个句子,它不会让你。我如何将我的csv文件输入到下面的示例中,为我提供所有行的极性?

>>> testimonial = TextBlob("Textblob is amazingly simple to use. What great fun!")
>>> testimonial.sentiment
Sentiment(polarity=0.39166666666666666, subjectivity=0.4357142857142857)
>>> testimonial.sentiment.polarity
0.39166666666666666

编辑了chishaku解决方案,它对我有用。解决方案:

import csv
from textblob import TextBlob

infile = 'xxx.csv'

with open(infile, 'r') as csvfile:
    rows = csv.reader(csvfile)
    for row in rows:
        sentence = row[0]
        blob = TextBlob(sentence)
        print blob.sentiment

2 个答案:

答案 0 :(得分:5)

在处理CSV时我非常喜欢pandas,尽管这对于您想要实现的目标来说太过通用了。但也许你会想要对你的数据做更多的处理,所以我发布了大熊猫解决方案。

import pandas as pd

# To read a CSV file
# df = pd.read_csv('sentences.csv')
df = pd.DataFrame({'sentence': ['I am very happy', 'I am very sad', 'I am sad but I am happy too']})

from textblob import TextBlob

# The x in the lambda function is a row (because I set axis=1)
# Apply iterates the function accross the dataframe's rows
df['polarity'] = df.apply(lambda x: TextBlob(x['sentence']).sentiment.polarity, axis=1)
df['subjectivity'] = df.apply(lambda x: TextBlob(x['sentence']).sentiment.subjectivity, axis=1)

>>> print(df)
                      sentence  polarity  subjectivity
0              I am very happy      1.00             1
1                I am very sad     -0.65             1
2  I am sad but I am happy too      0.15             1

答案 1 :(得分:3)

您需要遍历csv文件中的每一行。

首先,打开csv文件。

然后,对于文件中的每一行,我们可以使用row[0]访问行中的第一列。

import csv
from textblob import TextBlob

infile = '/path/to/file.csv'

with open(infile, 'r') as csvfile:
    rows = csv.reader(csvfile)
    for row in rows:
        sentence = row[0]
        blob = TextBlob(sentence)
        print sentence
        print blob.sentiment.polarity, blob.sentiment.subjectivity