我是数据挖掘的新手,目前正在使用RapidMiner中的TOI在线新闻文章。我的目标是获得结果,显示文章中提到的最重要的事情或找到隐藏在其中的有价值的信息。
我完成了对文章“TOI宣言”http://timesofindia.indiatimes.com/home/specials/lok-sabha-elections-2014/news/TOI-manifesto-An-agenda-for-the-new-government/articleshow/31973967.cms的文件处理。 我已经应用了标记化,过滤和ngrams并得到了一些结果。
我被困在这里。我不知道如何继续前进。我应该在RapidMiner中使用哪种技术/算法来获得所需的结果?
答案 0 :(得分:1)
您不是在寻找数据挖掘。数据挖掘是先进的统计方法。
通常关注定量分析。
您正在寻找自然语言处理。你没有大型数据库。
您有一份文件。你不想要定量结果,但是要有资格。您使用的是错误的工具。