从URL读取.xml.bz2到R中

时间:2014-05-15 22:24:18

标签: xml r

我目前正在尝试从加拿大环境部自动化天气预报过程。感兴趣的网站位于:

http://dd.weatheroffice.ec.gc.ca/ensemble/naefs/xml/20140515/12/WIND-SFC/raw/

我试图使用getURL,xmlTreeParse,bzfile和download.file但是每个都以不同的方式失败。

  

download.file(“HTTP:/dd.weatheroffice.ec.gc.ca/ensemble/naefs/xml/20140515/00/TMP-SFC/raw/2014051500_GEPS-NAEFS-RAW_ABBOTSFORD_BC_CA_TMP-SFC_000-384.xml.bz2 ”基本名( “HTTP:/dd.weatheroffice.ec.gc.ca/ensemble/naefs/xml/20140515/00/TMP-SFC/raw/2014051500_GEPS-NAEFS-RAW_ABBOTSFORD_BC_CA_TMP-SFC_000-384.xml.bz2”))

     

错误   download.file( “HTTP:/dd.weatheroffice.ec.gc.ca/ensemble/naefs/xml/20140515/00/TMP-SFC/raw/2014051500_GEPS-NAEFS-RAW_ABBOTSFORD_BC_CA_TMP-SFC_000-384.xml.bz2”   :不支持的URL方案

     

xmlTreeParse( “HTTP:/dd.weatheroffice.ec.gc.ca/ensemble/naefs/xml/20140515/00/TMP-SFC/raw/2014051500_GEPS-NAEFS-RAW_ABBOTSFORD_BC_CA_TMP-SFC_000-384.xml.bz2”)

     

错误:XML内容似乎不是XML:   的 'http:/dd.weatheroffice.ec.gc.ca/ensemble/naefs/xml/20140515/00/TMP-SFC/raw/2014051500_GEPS-NAEFS-RAW_ABBOTSFORD_BC_CA_TMP-SFC_000-384.xml.bz2'

Bzfile确实会产生输出但是我无法使用该输出来生成数据。我已经查看了许多关于XML的其他问题,但似乎很多其他人在本地机器上都有这些文件,我想避免这些。还有一些人没有处理bz2 xmls,但是我不相信,这是我的问题。

有什么想法吗?

提前致谢!

1 个答案:

答案 0 :(得分:0)

可能会在你身边。我没有收到任何错误:

 download.file("http://dd.weatheroffice.ec.gc.ca/ensemble/naefs/xml/20140515/00/TMP-SFC/raw/2014051500_GEPS-NAEFS-RAW_ABBOTSFORD_BC_CA_TMP-SFC_000-384.xml.bz2", 
                  destfile="test")

trying URL 'http://dd.weatheroffice.ec.gc.ca/ensemble/naefs/xml/20140515/00/TMP-SFC/raw/2014051500_GEPS-NAEFS-RAW_ABBOTSFORD_BC_CA_TMP-SFC_000-384.xml.bz2'
Content type 'application/x-bzip2' length 6370 bytes
opened URL
==================================================
downloaded 6370 bytes