解决Ruby的Parser问题

时间:2010-07-08 11:24:27

标签: ruby

有人知道Ruby的地址解析器插件吗?

我可能不得不使用其中一个付费的网络服务,但认为可能有一个插件。

另一个想法是沿着NLP路线走下去,在那里我可以建立一个数据库。

有人为ruby使用任何NLP插件吗?

我想用它从HTML中逻辑解析和清理这样的东西:

  <address><strong>HALL (J&amp;E) LTD</strong><br />Head Office<br />
    Questor House<br />
    191 Hawley Road<br />
    Dartford<br />
    Kent <br />
    DA1 1PU</address>
    <p class="tel"><strong>Tel:</strong> +44 (0)1322 223456</p>
    <p class="fax"><strong>Fax:</strong> +44 (0)1322 291458</p>
    <p><strong>Website:</strong> <a target="_blank" href="http://www.jehall.co.uk">www.jehall.co.uk</a></p>
    <p><strong>Email:</strong> <a href="mailto&#58;helpline&#64;jehall&#46;co&#46;uk?subject=Enquiry%20from%20Defence%20Suppliers%20Directory&amp;cc=defenceenquiries&#64;armedforces&#46;co&#46;uk">helpline&#64;jehall&#46;co&#46;uk</a></p>
</div>

任何建议都很高兴。

1 个答案:

答案 0 :(得分:1)

Googles地理编码服务可能会取得一些成功。这可以返回结构化地址。有用于与Googles maps API接口的红宝石宝石