我想从短荷兰文本中提取关键词。是否有我可以使用的这个或某个库的API。
如果没有荷兰语的话,我们也很感激如何提取它们。我已经通过一部分语音标记器和变形器运行文本来尝试自己。但从那时起,我发现提取体面的关键词非常困难。 TF-IDF没有用,因为sice文本太短而无法获得良好的结果。
我更喜欢Java,但任何其他语言实现也非常受欢迎。
答案 0 :(得分:2)
以下是我使用RapidMiner进行文本挖掘的视频系列。它展示了如何轻松获得TF-IDF等等:
http://vancouverdata.blogspot.ca/2010/11/text-analytics-with-rapidminer-loading.html