我想从网站上删除一些数据。但我遇到的问题是我废弃的数据类型是字符。我想将它转换为数据框,就像你从这个网站看到的一样。
http://app.finance.ifeng.com/hq/stock_daily.php?code=sh600030
require(RCurl)
require(rjson)
library(stringr)
library(XML)
url="http://app.finance.ifeng.com/hq/stock_daily.php?code=sh600030"
SOURCE <- getURL(url,encoding="UTF-8")
PARSED <- htmlParse(SOURCE)
k <- xpathSApply(PARSED, "//td",xmlValue)
答案 0 :(得分:0)
使用readHTMLTable
url="http://app.finance.ifeng.com/hq/stock_daily.php?code=sh600030"
SOURCE <- getURL(url,encoding="UTF-8")
DF <- readHTMLTable(SOURCE)[[1]]
但你应该正确编码中文字符。老实说,不要知道这个topit。
> head(DF)
日期 开盘价 最高价 最低价 收盘价 æˆäº¤é‡ æˆäº¤é¢ æ¶¨è·Œé¢ æ¶¨è·Œå¹…
1 N 2015-01-13 33.21 33.64 31.77 32.17 6243921<U+624B> 2034644<U+4E07> -1.36 -4.06%
2 N 2015-01-12 34.70 35.38 33.23 33.53 6602672<U+624B> 2258232<U+4E07> -1.43 -4.09%
3 N 2015-01-09 35.01 36.90 34.41 34.96 7636402<U+624B> 2714229<U+4E07> -0.29 -0.82%
4 N 2015-01-08 36.40 36.70 34.68 35.25 6376268<U+624B> 2261846<U+4E07> -0.90 -2.49%
5 N 2015-01-07 34.41 37.25 34.29 36.15 7315085<U+624B> 2638717<U+4E07> 1.44 4.15%
6 2015-01-06 33.80 35.58 33.56 34.71 6681193<U+624B> 2314937<U+4E07> 0.05 0.14%