Question

我正试图通过推特中的twitteR软件包从推文提取中提取网址的文本 - 大约有3,000个 - 具体来说，我想要这条推文中网址中包含的经度和纬度数据： https://twitter.com/PGANVACentralCh/status/885702041275969536

但是，twitteR包会删除短格式URL目标：例如：https://t dot co斜线Y0pGeSiVFJ

我可以单独关注所有3,000个链接并复制并粘贴其网址，然后将其转换为经度和纬度，但必须有更简单的方法吗？

并不是因为这个特殊问题很重要，但我通过这段代码得到了推文：

#
library(twitteR)                       
library(httr) 
#
poketweets <- userTimeline("PGANVACentralCh", n = 3200)
poketweets_df <- tbl_df(map_df(poketweets, as.data.frame))
write.csv(poketweets_df, "poketweets.csv")

Answer 1

您需要获取Tweet对象中的entities.url.expanded_url值。我不相信twitteR支持返回的状态对象（status object fields只是Tweet JSON值的子集）。此外，twitteR现已弃用，而不是rtweet。

使用rtweet，您可以修改代码：

poketweets <- get_timeline("PGANVACentralCh", n = 50)
head(poketweets)

您可以在每个推文数据框中找到可以使用的urls_expanded字段。

R package（twitteR）返回短URL目标而不是URL文本

1 个答案: