标签: tagging entities data-extraction
我正在寻找从文本中提取实体的好解决方案。 在我的情况下,实体是电影标题(所以它们可能是很长的字符串),我将它们存储在数据库中。
这可能是一个很好的方法吗?是否有任何已开发的软件可以执行此类任务?
我见过nltk,但我需要的是不那么复杂:给定一个(巨大的)字符串列表,在输入文本中识别它们。
谢谢!