从jsp页面中提取信息

时间:2012-03-08 16:53:00

标签: r jsp web-scraping

我想从像this one这样的站点中提取一些信息,这些站点使用jsp来托管GIS服务器并提供长地址来对地址进行地理编码。例如,搜索“海洋公园”给我以下内容(您需要在键入并搜索地址后点击地图上的“显示坐标”按钮):

HK1980 Grid
Northing (m):   810598
Easting (m):    835698

Latitude/Longitude(in WGS84)
Latitude(N):    22°14' 2.75"
Longitude(E):   114°10' 16.84"

UTM Grid
Northing (m):   2461463
Easting (m):    208420
Grid Reference: 50Q KK 084 614

但是如果我需要输入所有地址并手动复制所有输出,这有点费时。我想知道这个过程是否可以通过编码完成,最好是R.需要RCurl包吗?感谢。

更新01

我玩了一些网站并设法使用此link更改了网站的语言。希望这能解决人们的语言障碍并帮助解决我的问题。提前谢谢。

1 个答案:

答案 0 :(得分:0)

不幸的是,我无法阅读该网站上的语言,但我一直在玩xml和JSON api以及HTML页面。我已经能够使用以下软件包执行此操作:

RCurl JSONIO - 解析JSON XML - 解析HTML和XML

这方面的一个例子是:Unable to pull text out of a scraped HTML page with R XML package