提取相邻的单词? (名称,街道,小溪,河流)

时间:2013-11-15 07:32:37

标签: extract geocoding street-address gsub

提取相邻的单词? (名称,街道,小溪,河流)

您好我正在寻找一个功能,我可以通过一个庞大的段落列表来提取“小溪”这个词,以便可以隔离小溪名称。

例如,给定的段落可能是:

  

“该遗址位于克拉克溪沿桥三英里的上游。”

理想的输出就是

  克拉克克里克

它必须是将“小溪”这个词作为标准查找并提取前一个词的内容,即使只是“Clark”也适合我。

我一直在玩RQSlite套装& gsub,但到目前为止没有运气......我确信这是一个常见的程序。

1 个答案:

答案 0 :(得分:1)

如果您正在提取实际地址,有些服务可以智能地执行此操作,甚至可以验证结果:http://smartystreets.com/products/liveaddress-api/extract(公平地说,您应该知道我帮助开发了这些,尽管我不再在那里工作。 )

对于地名,假设这个地方只有一个单词,你可以尝试一个简单的正则表达式:

/(?<=\s)(\S+\s+(Creek|Street|River))/ig

当然,我从来没有使用过RQSLite或gsub,但我想这样的话可以解决这个问题。