我正在玩情绪分析,我正在寻找一些种子数据。周围有免费的字典吗?
它可以非常简单:3组文本/句子,用于“正面”,“负面”,“中立”。它不一定非常庞大。
最终我可能会为我的特定用例生成自己的种子数据,但是在构建该东西的时候,现在可以玩一些东西会很棒。
答案 0 :(得分:4)
Bing Liu and Minqing Hu有许多数据集:
答案 1 :(得分:3)
如果您对情感词典感兴趣,许多作者已经提出了基于手动构建列表的工作,以及其他半自动化方法来获取自以为是的术语列表。一种好的方法是从WordNet数据库中导出它,通过使用像同义词等关系扩展正/负词的核心。
手动构建列表的一个很好的例子是General Inquirer。
对于派生列表的半自动方法,请查看Esuli和Sebastiani的SentiWordNet。
我相信这些通常可供研究使用,但您可能需要与作者联系,了解这些资源是否用于非研究目的。
乙
答案 2 :(得分:1)
您可以在此处使用AFINN单词列表:
http://www2.imm.dtu.dk/pubdb/views/publication_details.php?id=6010
AFINN是一个英文单词列表,其中包含一个整数的valence 在负五(负)和正五(正)之间。这些话有 由FinnÅrupNielsen在2009-2011年手动贴上标签。该文件是 制表符分隔。有两个版本:
AFINN-111:最新版本,包含2477个单词和短语。
AFINN-96:1480行1468个独特的单词和短语。请注意那里 是1480行,因为有些单词被列出两次。单词列表没有 完全按字母排序。
答案 3 :(得分:1)
我维护一份语料库和单词列表以供情绪分析(我的AFINN就是其中之一):
http://neuro.compute.dtu.dk/wiki/Sentiment_analysis#Corpora
http://neuro.compute.dtu.dk/wiki/Sentiment_analysis#Affective_word_lists