从字符串

时间:2018-01-02 08:56:02

标签: r

我有一个带文字的专栏;我希望从每个单元格中提取20%的随机单词。

示例数据:

text <- c("five1 five2 five3 five4 five5", "ten1 ten2 ten3 ten4 ten5 ten6 ten7 ten8 ten9 ten10", "fifteen1 fifteen2 fifteen3 fifteen4 fifteen5 fifteen6 fifteen7 fifteen8 fifteen9 fifteen10 fifteen11 fifteen12 fifteen13 fifteen14 fifteen15")
id <- c(1, 2, 3)
df <- data.frame(text, id)

这是最终结果的示例:

 df$text_20_random_percent <- c("five4", "ten7 ten2", "fifteen2 fifteen12 fifteen3")

我尝试使用sample()功能但没有成功。

1 个答案:

答案 0 :(得分:3)

一种选择是使用strsplit将字符串拆分为子字符串,通过将sample指定为{{1}的X%来获取split字的size 1}}和length一起

paste