我目前在Ruby中编写了一个基于arc90可读性代码的算法,用于从网页中提取文章。
现在我有了这篇文章,我想从中提取关键字和具体信息(姓名,作者等)
我听说炼金术是一个很好的红宝石宝石,虽然它消耗了大量的资源。我可以使用更好的宝石吗?
答案 0 :(得分:9)
快速,轻量且易于使用的gem,用于从较长内容中提取关键字:
https://rubygems.org/gems/highscore
我在制作中使用它,就像一个魅力。
这个问题有点老了,但我会留在这里给其他来自Google的人看看这个问题。
答案 1 :(得分:2)
有一个OpenCalais gem提供类似的功能。除了实体提取之外,它还可以检测实体之间的事件和关系。它不是轻量级的,但我不知道它是否比炼金术更好或更差,因为我没有使用Alchemy宝石。希望这会有所帮助。