使用实体列表标记/实体提取

时间:2013-06-03 17:26:33

标签: tagging entities data-extraction

我正在寻找从文本中提取实体的好解决方案。 在我的情况下,实体是电影标题(所以它们可能是很长的字符串),我将它们存储在数据库中。

这可能是一个很好的方法吗?是否有任何已开发的软件可以执行此类任务?

我见过nltk,但我需要的是不那么复杂:给定一个(巨大的)字符串列表,在输入文本中识别它们。

谢谢!

0 个答案:

没有答案