我有一个旅行者数据集,作为Origin国家有200个级别,目的地有相同的200个级别。从此我已经过滤掉了一个用户特定记录。 的exaple:
User Origin Destination
A Sing AUS
A Sing JAP
A Sing US
A Sing CHINA
A USA Africa
从这里我写了一个查询来探索变量值:
user$Origin
显示为
[1] Sing USA
200 levels : AUS,AFR,AGN........USA,ZMB.
我的问题是
如何更改等级?
答案 0 :(得分:0)
如果您要移除droplevels
以外的levels
,可以使用subset
。
traveler1 <- subset(traveler, User=="A")
traveler1$Origin
#[1] AGN AFR AUS AUS AFR
#Levels: AFR AGN AUS Sing USA ZMB
traveler2 <- droplevels(traveler1)
traveler2$Origin
#[1] AGN AFR AUS AUS AFR
#Levels: AFR AGN AUS
set.seed(24)
traveler <- data.frame(User=sample(LETTERS[1:5], 25, replace=TRUE),
Origin=sample(c("AUS", "AFR", "AGN", "Sing", "USA", "ZMB"), 25, replace=TRUE),
Destination=sample(c("AUS", "AFR", "JAP", "US", "CHINA", "Africa"), 25, replace=TRUE))
答案 1 :(得分:0)
我们可以直接再次考虑该变量,而不是降低等级......
即..,
factor(user$Origin)
[1]唱美国
2 Levels
默认情况下,它会再次分割水平。
感谢所有