我需要从链接中获取YouTube视频的名称。 通常,我可以为维基百科页面执行类似的操作:
doc <- xmlTreeParse("http://en.wikipedia.org/wiki/Google", useInternalNodes=TRUE)
xpathSApply(doc,'//title',xmlValue)
但以下内容对youtube不起作用:
doc <- xmlTreeParse("https://www.youtube.com/watch?v=YuOBzWF0Aws", useInternalNodes=TRUE)
给出错误。
非常感谢任何帮助。
答案 0 :(得分:3)
XML
库无法下载安全链接。您可以使用RCurl
和getURL
下载文件,然后使用XML
库进行解析,或者在这种情况下请求非安全版本(http
):
library(XML)
appURL <- "http://www.youtube.com/watch?v=YuOBzWF0Aws"
doc <- htmlParse(appURL)
sapply(doc['//*[@id="eow-title"]'], xmlGetAttr, name = "title")
> sapply(doc['//*[@id="eow-title"]'], xmlGetAttr, name = "title")
[1] "If Google was a Guy"