有人知道Ruby的地址解析器插件吗?
我可能不得不使用其中一个付费的网络服务,但认为可能有一个插件。
另一个想法是沿着NLP路线走下去,在那里我可以建立一个数据库。
有人为ruby使用任何NLP插件吗?
我想用它从HTML中逻辑解析和清理这样的东西:
<address><strong>HALL (J&E) LTD</strong><br />Head Office<br />
Questor House<br />
191 Hawley Road<br />
Dartford<br />
Kent <br />
DA1 1PU</address>
<p class="tel"><strong>Tel:</strong> +44 (0)1322 223456</p>
<p class="fax"><strong>Fax:</strong> +44 (0)1322 291458</p>
<p><strong>Website:</strong> <a target="_blank" href="http://www.jehall.co.uk">www.jehall.co.uk</a></p>
<p><strong>Email:</strong> <a href="mailto:helpline@jehall.co.uk?subject=Enquiry%20from%20Defence%20Suppliers%20Directory&cc=defenceenquiries@armedforces.co.uk">helpline@jehall.co.uk</a></p>
</div>
任何建议都很高兴。
答案 0 :(得分:1)
Googles地理编码服务可能会取得一些成功。这可以返回结构化地址。有用于与Googles maps API接口的红宝石宝石