我有一个这样的数据框:
type | length | freq
-----|--------|------
A | 100 | 2
B | 100 | 1
A | 200 | 1
B | 200 | 0
A | 300 | 3
B | 300 | 1
...
我正在使用此代码从freq列生成整洁的数据:
df <- df[rep(row.names(df), df$freq),]
df$freq <- NULL
导致
| type | length
----|------|--------
1.1 | A | 100
1.2 | A | 100
2 | B | 100
3 | A | 100
4.1 | A | 300
4.2 | A | 300
4.3 | A | 300
5 | B | 300
注意嵌套的行索引。
当将其绘制为箱线图(ggplot(df, aes(type, length)) + geom_boxplot()
)时,ggplot会为每种类型和长度创建一个箱线图,可能是因为嵌套的行索引。
(旁注:write.csv(df, 'table.csv'); df <- read.csv('table.csv')
解决了这个问题)
有没有办法取消这些行索引?