我正在尝试编写一个程序,将文本(文章)作为输入并输出该文本的极性,将其置于正面或负面的情绪中。我已经广泛阅读了不同的方法,但我仍然感到困惑。我读过许多技术,如分类器和机器学习。我想指导和明确指示从哪里开始。例如,我有一个需要数据集的分类器,但我如何将文本(文章)转换为分类器的数据集。如果有人能告诉我解决这个问题的逻辑顺序。提前致谢! PS:请提及任何相关算法或开源实现
此致 麦克
答案 0 :(得分:7)
如果您使用的是Python,我建议您查看NLTK和NLTK book。
此博客:streamhacker.com有一些非常好的文章可以帮助您入门。
自2000年末以来,该领域进行了大量研究。
更新(2013年10月):
斯坦福大学的研究在情绪分析方面取得了突破,平均准确率达到了85%以上。 (http://gigaom.com/2013/10/03/stanford-researchers-to-open-source-model-they-say-has-nailed-sentiment-analysis/)
答案 1 :(得分:0)
答案 2 :(得分:0)
您可以查看WEKA软件。它有许多内置的机器学习分类器,可用于情感分类。 它要求您将输入数据转换为ARFF格式。
答案 3 :(得分:0)
你可以找到一些有趣的数据集,从NLP,NER到图像分类,边界在这里:https://dataturks.com/projects/trending
答案 4 :(得分:-1)
如果你是nlp和python的初学者,那么你可以尝试一些优秀的api来进行情绪分析。
以下是一些可用于执行任务的Api