我正试图通过推特中的twitteR软件包从推文提取中提取网址的文本 - 大约有3,000个 - 具体来说,我想要这条推文中网址中包含的经度和纬度数据: https://twitter.com/PGANVACentralCh/status/885702041275969536
但是,twitteR包会删除短格式URL目标: 例如:https://t dot co斜线Y0pGeSiVFJ
我可以单独关注所有3,000个链接并复制并粘贴其网址,然后将其转换为经度和纬度,但必须有更简单的方法吗?
并不是因为这个特殊问题很重要,但我通过这段代码得到了推文:
#
library(twitteR)
library(httr)
#
poketweets <- userTimeline("PGANVACentralCh", n = 3200)
poketweets_df <- tbl_df(map_df(poketweets, as.data.frame))
write.csv(poketweets_df, "poketweets.csv")
答案 0 :(得分:1)
您需要获取Tweet对象中的entities.url.expanded_url
值。我不相信twitteR支持返回的状态对象(status object fields只是Tweet JSON值的子集)。此外,twitteR现已弃用,而不是rtweet。
使用rtweet,您可以修改代码:
poketweets <- get_timeline("PGANVACentralCh", n = 50)
head(poketweets)
您可以在每个推文数据框中找到可以使用的urls_expanded字段。