我试图了解如何将t.co网址转换为大网址?
我有一个7,175 t.co URL的数据集。我有点知道如何将单个URL转换为大URL(使用httr::GET
)。但是,当涉及到7,175个URL时,我应该使用sapply
在所有URL上应用Get
函数(在R中,这可以通过httr
包来完成)。
例如,假设我的数据集名称为“ urls_common”,其中包含两个变量:source_url(包含t.co url)和每个URL的计数。我使用以下代码集将t.co转换为大网址。
urls <- t(sapply(urls_common$source_url, GET)) %>%
as_tibble() %>%
select(urls, status_code)
但是我得到了不同的错误,例如:
curl :: curl_fetch_memory(url,handle = handle)中的错误: 无法连接至jamaica-gleaner.com端口80:连接被拒绝
OR
curl :: curl_fetch_memory(url,handle = handle)中的错误: 来自服务器的空回复
当我在较小的数据集(例如第一个或第二个或第三个500 t.co URL)上运行上述代码时,它有时对于某些数据集效果很好,并且有时会出现以下错误:
curl :: curl_fetch_memory(url,handle = handle)中的错误: 无法解析主机:my-news-feed.com
curl :: curl_fetch_memory(url,handle = handle)中的错误: SSL证书问题:证书已过期
curl :: curl_fetch_memory(url,handle = handle)中的错误: 无法解析主机:experience.safety
希望您能帮助我解决此错误。