使用R解析Web源代码

时间:2018-01-24 08:12:19

标签: r web-scraping html-parsing

我想从网站自动下载。

要自动制作,请从网站来源输入dcm_no

我使用htmlTreeParsegetNodeSet,如下所示

doc2 <- htmlTreeParse("http://dart.fss.or.kr/dsaf001/main.do?rcpNo=20171114001007#download", useInternalNodes=TRUE, trim=TRUE)
dcmno <- getNodeSet(doc2,"//a",)
dcmno2 <- dcmno[[2]]
print(dcmno2)
dcm_no <- substr(dcmno2,10,12)
print(dcm_no)

但它无法仅打印dcm_no

我搜索了很多东西,但是我找不到。

如何仅从网站来源获取dcm_no

0 个答案:

没有答案