我有一个数据框,我想从中抽取一个随机样本-不仅仅是一个样本,还包含一个word
列中每个唯一值中恰好包含一个随机采样行的样本:
set.seed(123)
df <- data.frame(
word = sample(LETTERS[1:5], 50, replace = T),
value = sample(1:10, 50, replace = T)
)
head(df)
word value
1 B 1
2 D 5
3 C 8
4 E 2
5 E 6
6 A 3
我为解决此问题所做的事情是: 1.在向量中存储唯一的单词:
UniqueWords <- unique(df$word)
2。设置一个for
循环:
for(i in UniqueWords){
df_sample[i,] <- df[sample(1:nrow(df[df$word==UniqueWords[i], ]), 1), ]
}
但是,循环无法产生正确的结果。如何进行调整,或者可以使用其他什么方法?