我想检查有关Udemy课程的某些URL是否有效。让我们从URL开始:
# URL which contains a course that has been removed from Udemy
url_noCourse <- "https://www.udemy.com/draft/1564158/?siteID=RUxZriH.PWc-x2v27L1vQgG_VZYYYDliMg&LSNPUBID=RUxZriH*PWc"
# URL which contains a course that is still on Udemy
url_yesCourse <- "https://www.udemy.com/lx0-104-comptia-linux-powered-by-lpi-practice-test-d/?siteID=RUxZriH.PWc-m4fhEs8ft5XtkpJM31f.Bg&LSNPUBID=RUxZriH*PWc"
如果课程存在或不存在,我想获取一个逻辑值(TRUE
/ FALSE
)。因此,url_noCourse
应该是FALSE
,而url_yesCourse
应该是TRUE
。
但是,当使用url.exists()
程序包中的功能RCurl
和http_error()
程序包中的httr
时,它们似乎无法辨别哪条路线仍然在平台上,而没有。
> http_error(url_noCourse)
[1] TRUE
> http_error(url_yesCourse)
[1] TRUE
> url.exists(url_noCourse)
[1] FALSE
> url.exists(url_yesCourse)
[1] FALSE
http_error()
的所有课程均为TRUE
,而url.exists()
的所有课程均为FALSE
。
我在这个论坛上一直在阅读不同的问题(1,2,3),但是这些问题似乎对我的情况没有帮助。
有什么想法要在R中解决吗?