我有一个data.frame中的推文列表,我可以使用
从中提取主题标签列表> rpg.twitter.df$hashtags <-
regmatches(rpg.twitter.df$text,gregexpr("#(\\d|\\w)+",rpg.twitter.df$text))
最后每行有一个列表。现在,我想用逗号分隔的字符串(每行一个)展平每个列表
我试过了:
do.call("paste", c(rpg.twitter.df$hashtags, sep=", "))
但它不起作用,因为它最终有一个巨大的向量。如果我将regmatches
与unlist(..., recursive=FALSE)
关于如何解决它的任何想法?
可重复示例的一些数据:
rpg.twitter.df <- data.frame(text=rbind("World of Warcrack: http://t.co/3MNRpArnGw #wow #WorldOfWarcraft #warcraft #mmorpg #rpg #RPGChat #gaming #pcgaming #online @WoW_en @NewsWoW", "@ashleythedragon join my journey in Tweeria http://t.co/CFKDLA3ASE #rpg", "How to use of #RPG for motivation #timeboxing http://t.co/mwwN5xErHx"))
答案 0 :(得分:3)
你可以这样做:
sapply(rpg.twitter.df$hashtags, paste, collapse = ",")
答案 1 :(得分:2)
您也可以使用:
toString(rpg.twitter.df$hashtags)