从网站上拉文字

时间:2014-01-31 21:40:20

标签: web-scraping

我面前有一项任务,要记录成千上万的公共土地信息 我基本上把它记录在电子表格上。我需要从这些记录中获得3条信息。部分乡镇范围是我所关心的。

http://i843.photobucket.com/albums/zz360/mattr1992/ndrin_zpsdc360ac8.png

这是我的资源,因为你可以看到每个条目都有我正在寻找的部分/乡镇/范围,尽管它们都是独特的条目而且不一样

我想将每个条目的部分/乡镇/范围拉入电子表格。我该怎么做?

1 个答案:

答案 0 :(得分:0)

如果您可以将网页复制到纯文本文件中,则可以使用正则表达式(如section: [0-9]* township: [0-9]* range: [0-9]*)捕获所有信息,然后导入Excel,这样可以轻松地将它们分成不同的表格。