宪报清单应包括哪些内容?

时间:2018-07-10 09:20:31

标签: stanford-nlp

我正在尝试从酒店评论中提取位置,我所指的是酒店名称,城市,社区,兴趣点和国家/地区。我正在使用带有165,000个实体的宪报列表[此列表没有酒店名称]标记为location。 我已经打开了草率的宪报,但是这个宪报并没有太大帮助。我对应将我列入宪报清单感到困惑。

PS:就NLP而言,我是新手,因此对于使用哪些功能的帮助不多。

1 个答案:

答案 0 :(得分:0)

您好,这里有关于NER功能的新的更详细的文档:

https://stanfordnlp.github.io/CoreNLP/ner.html

规则格式是每行一条规则:

Los Angeles CITY LOCATION,MISC 1.0

Great Wall Of China LANDMARK LOCATION,MISC 1.0

仅当您使用GitHub上的最新代码时,某些功能才可用,但Stanford CoreNLP 3.9.1中有很多功能可用

简而言之,NER注释器运行以下步骤:

  1. 统计NER模型
  2. 数字序列和SUTime(时间和日期)的规则
  3. 细粒度NER(CITY,STATE_OR_PROVINCE,COUNTRY等)的规则
  4. 用户指定的其他规则(这是新规则,目前在3.9.1中不可用)
  5. 构建实体提及(标识令牌“ Los”和“ Angeles”应为实体“ Los Angeles”)

您可以从GitHub下载代码并构建最新版本,也可以按照上述链接中的说明将自定义规则添加到ner.fine.regexner注释器中。