Question

我有一个data.frame中的推文列表，我可以使用

从中提取主题标签列表

> rpg.twitter.df$hashtags <-
  regmatches(rpg.twitter.df$text,gregexpr("#(\\d|\\w)+",rpg.twitter.df$text))

最后每行有一个列表。现在，我想用逗号分隔的字符串（每行一个）展平每个列表

我试过了：

do.call("paste", c(rpg.twitter.df$hashtags, sep=", "))

但它不起作用，因为它最终有一个巨大的向量。如果我将regmatches与unlist(..., recursive=FALSE)

括起来，则相同

关于如何解决它的任何想法？

可重复示例的一些数据：

rpg.twitter.df <- data.frame(text=rbind("World of Warcrack: http://t.co/3MNRpArnGw #wow #WorldOfWarcraft #warcraft #mmorpg #rpg #RPGChat #gaming #pcgaming #online @WoW_en @NewsWoW", "@ashleythedragon join my journey in Tweeria http://t.co/CFKDLA3ASE #rpg", "How to use of #RPG  for motivation  #timeboxing  http://t.co/mwwN5xErHx"))

Answer 1

你可以这样做：

sapply(rpg.twitter.df$hashtags, paste, collapse = ",")

Answer 2

您也可以使用：

 toString(rpg.twitter.df$hashtags)

使用R在数据框中逐行取消列表（展平列表）

2 个答案: