我正在寻找斯坦福NER,并考虑使用JAVA Apis来从文本文档中提取邮政地址。该文件可以是任何有邮政地址部分的文件,例如公用事业票据,电费单。
所以我的想法是,
我正在尝试找到相同的示例管道(需要详细说明的步骤是什么),之前有人做过这个吗?建议欢迎。
答案 0 :(得分:1)
要明确:所有功劳都归功于在[java-nlp-user]邮件列表上进行互动的Raj Vardhan(和John Bauer)。
Raj Vardhan写了关于“在句子中查找街道地址”的计划:
这是我想到的一种方法:
- 在句子中找到 event-anchor
- 从该事件节点中选择 SemanticGraph 中的传出边 与*“准备”*或“准备”等关系。
- 如果关系中的从属值具有POS标记为NNP
醇>a)从依赖值节点中找出具有关系的传出边缘 as “nn”
b)以递增的顺序连接所有这些节点 句。
c)PRINT结果值作为事件发生的位置
这显然具有某些假设,例如直接依赖 在事件锚点和句子中的位置之间。
不确定这是否可以帮到你,但我想提一下以防万一。同样,任何功劳都归功于Raj Vardhan(和John Bauer)。