目前我正致力于一个项目,即使用Python和NLTK在聊天应用程序中从文本中检测情绪(快乐,悲伤等)。我对NLP和Python不是很熟悉。作为一种基本方式,我希望使用基于关键字的方法。在这种情况下,我必须在每个情绪状态下制作情绪关键词列表,并且需要找出给定句子中是否存在任何情绪关键词并相应地识别相关的情绪状态。所以我需要知道的是,我是否需要创建一个训练数据集和功能列表来执行该任务,如果是,我该怎么做。请帮我。
答案 0 :(得分:1)
您需要一组已标记的单词。一个开始的地方是AFINN情绪字典,它是一组手动标记的大量单词。 Ku-Ting Kuo的slides展示了如何使用AFINN字集。
劳伦特·卢斯的blog使用推文来完成整个情绪分析过程,尽管他从标记的训练集开始。
另请参阅NLTK'如何使用'在sentiment analysis
有许多情感数据集可能对https://www.w3.org/community/sentiment/wiki/Datasets#Emotions_datasets_by_Media_Core_.40_UFL有帮助。