从短荷兰文本中提取关键字

时间:2012-10-18 14:28:31

标签: keyword text-processing extraction text-mining linguistics

我想从短荷兰文本中提取关键词。是否有我可以使用的这个或某个库的API。

如果没有荷兰语的话,我们也很感激如何提取它们。我已经通过一部分语音标记器和变形器运行文本来尝试自己。但从那时起,我发现提取体面的关键词非常困难。 TF-IDF没有用,因为sice文本太短而无法获得良好的结果。

我更喜欢Java,但任何其他语言实现也​​非常受欢迎。

1 个答案:

答案 0 :(得分:2)

以下是我使用RapidMiner进行文本挖掘的视频系列。它展示了如何轻松获得TF-IDF等等:

http://vancouverdata.blogspot.ca/2010/11/text-analytics-with-rapidminer-loading.html