R package(twitteR)返回短URL目标而不是URL文本

时间:2017-07-14 03:44:20

标签: r twitter web-scraping

我正试图通过推特中的twitteR软件包从推文提取中提取网址的文本 - 大约有3,000个 - 具体来说,我想要这条推文中网址中包含的经度和纬度数据: https://twitter.com/PGANVACentralCh/status/885702041275969536

但是,twitteR包会删除短格式URL目标: 例如:https://t dot co斜线Y0pGeSiVFJ

可以单独关注所有3,000个链接并复制并粘贴其网址,然后将其转换为经度和纬度,但必须有更简单的方法吗?

并不是因为这个特殊问题很重要,但我通过这段代码得到了推文:

#
library(twitteR)                       
library(httr) 
#
poketweets <- userTimeline("PGANVACentralCh", n = 3200)
poketweets_df <- tbl_df(map_df(poketweets, as.data.frame))
write.csv(poketweets_df, "poketweets.csv")

1 个答案:

答案 0 :(得分:1)

您需要获取Tweet对象中的entities.url.expanded_url值。我不相信twitteR支持返回的状态对象(status object fields只是Tweet JSON值的子集)。此外,twitteR现已弃用,而不是rtweet

使用rtweet,您可以修改代码:

poketweets <- get_timeline("PGANVACentralCh", n = 50)
head(poketweets)

您可以在每个推文数据框中找到可以使用的urls_expanded字段。