获取YouTube视频的名称

时间:2014-07-10 23:40:33

标签: xml r youtube

我需要从链接中获取YouTube视频的名称。 通常,我可以为维基百科页面执行类似的操作:

doc <- xmlTreeParse("http://en.wikipedia.org/wiki/Google", useInternalNodes=TRUE)
xpathSApply(doc,'//title',xmlValue)

但以下内容对youtube不起作用:

doc <- xmlTreeParse("https://www.youtube.com/watch?v=YuOBzWF0Aws", useInternalNodes=TRUE)

给出错误。

非常感谢任何帮助。

1 个答案:

答案 0 :(得分:3)

XML库无法下载安全链接。您可以使用RCurlgetURL下载文件,然后使用XML库进行解析,或者在这种情况下请求非安全版本(http):

library(XML)
appURL <- "http://www.youtube.com/watch?v=YuOBzWF0Aws"
doc <- htmlParse(appURL)
sapply(doc['//*[@id="eow-title"]'], xmlGetAttr, name = "title")

> sapply(doc['//*[@id="eow-title"]'], xmlGetAttr, name = "title")
[1] "If Google was a Guy"