什么是一个好的NLP库能够猜出给定段落的标题?

时间:2013-05-30 09:42:46

标签: ruby nlp

例如,如果我有文字:(从Quora上的问题中取出的随机段落)

  西南亚的战争 - 美国军队的存在缓解了这一局面   在SW的地面上有超过10万美军   亚洲。德国是前往阿富汗的部队的起点   以及整个SW亚洲的基地。如果美国要离开,   替代设施要么必须租赁或建造   支持阿富汗和阿富汗的任何力量   还支持美国在波斯湾的军事行动。这个会   还花费了数百亿美元,而这些数字并不存在。

图书馆能够确定合适的标题:

  

SW亚洲和美国驻德军的战争

这可能吗?有没有可用的库?

1 个答案:

答案 0 :(得分:2)

是的,这在理论上是可行的,但它是一个涉及多层数据处理的难题,并且是一个很好的后备数据集,可以帮助引导任何机器学习方面的任务。这是一个项目,可能涉及多个工程师,他们是该领域的专家,工作时间很长。

不,没有一个简单的Ruby库。甚至不是一个执行任务的Web服务的客户端。

您可能需要查看一些基本的Ruby NLP gem和数据集,以了解当前代码和服务的范围。例如,概念网:http://conceptnet5.media.mit.edu/ 可能是一个有趣的地方,开始查看这样的问题 - 我不知道任何Ruby包装器,虽然JSON格式应该只是可以访问红宝石。

或者,如果您的任务是针对商业项目,并且您可以为每个摘要支付少量费用,那么您可能需要考虑使用像Mechanical Turk这样的人力服务,其中有一个Ruby gem:{ {3}}