使用Stanford NER从文本文档中提取地址?

时间:2015-12-22 04:16:05

标签: java stanford-nlp text-processing

我正在寻找斯坦福NER,并考虑使用JAVA Apis来从文本文档中提取邮政地址。该文件可以是任何有邮政地址部分的文件,例如公用事业票据,电费单。

所以我的想法是,

  1. 使用LOCATION和其他原始命名实体将邮政地址定义为命名实体。
  2. 定义细分和其他子流程。
  3. 我正在尝试找到相同的示例管道(需要详细说明的步骤是什么),之前有人做过这个吗?建议欢迎。

1 个答案:

答案 0 :(得分:1)

要明确:所有功劳都归功于在[java-nlp-user]邮件列表上进行互动的Raj Vardhan(和John Bauer)。

Raj Vardhan写了关于“在句子中查找街道地址”的计划:

  

这是我想到的一种方法:

     
      
  1. 在句子中找到 event-anchor
  2.   
  3. 从该事件节点中选择 SemanticGraph 中的传出边   与*“准备”*或“准备”等关系。
  4.   
  5. 如果关系中的从属值具有POS标记为NNP
  6.         

    a)从依赖值节点中找出具有关系的传出边缘   as “nn”

         

    b)以递增的顺序连接所有这些节点   句。

         

    c)PRINT结果值作为事件发生的位置

         

    这显然具有某些假设,例如直接依赖   在事件锚点和句子中的位置之间。

不确定这是否可以帮到你,但我想提一下以防万一。同样,任何功劳都归功于Raj Vardhan(和John Bauer)。