我希望你能给我一些建议,以解决这个问题。在大学里,我一直在解决意见挖掘任务,但在推特方面,这种做法却截然不同。例如,我使用了一种集合学习方法来分类用户对西班牙某酒店的意见。当然,我得到了一个有正面和负面意见的训练集,然后我用测试集进行了测试。但是现在,有了twitter,我发现这种分类非常困难。
我需要训练集吗?如果这个问题的答案是肯定的,你不觉得推特是如此昙花一现,所以如果我有这个设定,我对未来主题的表现会非常差吗?
我正在考虑获取字典(主要是形容词)并用它来交叉我的推文并获得一个术语 - 文档矩阵,但我没有分配给任何推特的课程。此外,正面形容词和否定形容词可能会因主题和时间而异。那么,如何处理呢?
如何处理语言问题?例如,我想研究用英语和西班牙语写的推文,但是分开。
您建议使用哪种编程语言来做这样的事情?我一直在尝试使用像tm,twitteR这样的R软件包。
答案 0 :(得分:1)
答案 1 :(得分:1)
此网站:https://sites.google.com/site/miningtwitter/questions/sentiment提供了3种使用R进行情感分析的方法。
现在更新了Twitter软件包以使用新的twitter API。我下载了包的源版本,以避免重复推文。
我正在研究西班牙语词典以进行意见挖掘,并会在某个地方发布可访问的内容。
喝彩!
答案 2 :(得分:0)
如上所述,情绪分析将仅给出3个结果-正面,负面和中立。我找到了有关Twitter情绪分析的教程,而且很简单。
我在这里找到它-https://www.ai-ml.tech/twitter-sentiment-analysis/
仅下载了3个依赖项,完成了较少的代码。只需经历一下,您就会找到解决方案。