文本挖掘单个文本文档

时间:2014-04-05 18:40:47

标签: data-mining text-mining rapidminer

我是数据挖掘的新手,目前正在使用RapidMiner中的TOI在线新闻文章。我的目标是获得结果,显示文章中提到的最重要的事情或找到隐藏在其中的有价值的信息。

我完成了对文章“TOI宣言”http://timesofindia.indiatimes.com/home/specials/lok-sabha-elections-2014/news/TOI-manifesto-An-agenda-for-the-new-government/articleshow/31973967.cms的文件处理。 我已经应用了标记化,过滤和ngrams并得到了一些结果。

我被困在这里。我不知道如何继续前进。我应该在RapidMiner中使用哪种技术/算法来获得所需的结果?

1 个答案:

答案 0 :(得分:1)

您不是在寻找数据挖掘。数据挖掘是先进的统计方法。

通常关注定量分析。

您正在寻找自然语言处理。你没有大型数据库。

您有一份文件。你不想要定量结果,但是要有资格。您使用的是错误的工具。