从文本句子生成标签

时间:2017-11-23 01:36:44

标签: java keyword tagging text-extraction pos-tagger

给出一个句子列表: 恩。

  1. 双人直升机之旅 - > [直升机,旅游]
  2. 直升机飞行课 - > [直升机,飞行,课程]
  3. 飞行之旅 - > [飞行,旅游]
  4. ..
  5. ...
  6. 我需要能够生成标签(例如每个条目旁边显示的标签。)

    我想手动将关键字添加到数据库表中。

    然后,

    迭代所有句子列表。对于每个句子,对句子进行标记化,针对关键字数据库检查每个标记,如果找到匹配,则生成标记。

    但是,如果我有一个庞大的关键词数据库(成千上万的关键词)和庞大的句子列表,这看起来会很慢。

    是否有更快速和优化的解决方案?

    我在我的项目中使用java和mongodb。

0 个答案:

没有答案