我想在R中分析一些地震数据。源HTML中的典型(很多)输出将是
<pre>
Year,Month,Day,Time(hhmmss.mm)UTC,Latitude,Longitude,Magnitude,Depth,Catalog
2012, 01, 01, 003008.77, 12.008, 143.487, 5.1, 35, PDE-W
.....
</pre>
我设法将逗号分隔数据转换为字符串,其中\ n应该分隔行,但不清楚如何继续进行 - 并且我不确定这是最好的方法。
library(XML)
url <- "http://neic.usgs.gov/cgi-bin/epic/epic.cgi?SEARCHMETHOD=1&FILEFORMAT=6&SEARCHRANGE=HH&SYEAR=2012&SMONTH=01&SDAY=01&EYEAR=2012&EMONTH=1&EDAY=31&LMAG=4&UMAG=&NDEP1=&NDEP2=&IO1=&IO2=&CLAT=0.0&CLON=0.0&CRAD=0.0&SUBMIT=Submit+Search"
data <- xpathSApply(basicInfo, "//*/pre/text()", xmlValue)
str(data) #chr "\n Year,Month,Day, .... Catalog\n 2012,
任何帮助表示赞赏
答案 0 :(得分:3)
data.df <- read.table(text = data, fill=TRUE, sep = ',',header=TRUE)
你得到了
head(data.df)
Year Month Day Time.hhmmss.mm.UTC Latitude Longitude Magnitude Depth Catalog
1 2012 1 1 3008.77 12.008 143.487 5.1 35 PDE-W
2 2012 1 1 4342.77 12.014 143.536 4.4 35 PDE-W
3 2012 1 1 5008.04 -11.366 166.218 5.3 67 PDE-W
4 2012 1 1 12207.66 -6.747 130.007 4.2 145 PDE-W
5 2012 1 1 23521.11 23.472 91.834 4.6 27 PDE-W
6 2012 1 1 24036.40 6.677 -73.110 4.0 158 PDE-W