为了提取关键词,还有比ruby alchemy更好的东西吗?

时间:2010-08-09 19:39:49

标签: ruby gem data-mining extract keyword

我目前在Ruby中编写了一个基于arc90可读性代码的算法,用于从网页中提取文章。

现在我有了这篇文章,我想从中提取关键字和具体信息(姓名,作者等)

我听说炼金术是一个很好的红宝石宝石,虽然它消耗了大量的资源。我可以使用更好的宝石吗?

2 个答案:

答案 0 :(得分:9)

快速,轻量且易于使用的gem,用于从较长内容中提取关键字:

https://rubygems.org/gems/highscore

我在制作中使用它,就像一个魅力。

这个问题有点老了,但我会留在这里给其他来自Google的人看看这个问题。

答案 1 :(得分:2)

有一个OpenCalais gem提供类似的功能。除了实体提取之外,它还可以检测实体之间的事件和关系。它不是轻量级的,但我不知道它是否比炼金术更好或更差,因为我没有使用Alchemy宝石。希望这会有所帮助。