Question

我有一个旅行者数据集，作为Origin国家有200个级别，目的地有相同的200个级别。从此我已经过滤掉了一个用户特定记录。的exaple：

 User   Origin    Destination
 A        Sing       AUS
 A        Sing       JAP
 A        Sing       US
 A        Sing       CHINA
 A        USA        Africa

从这里我写了一个查询来探索变量值：

user$Origin

显示为

[1]  Sing  USA
200 levels : AUS,AFR,AGN........USA,ZMB.

我的问题是

如何更改等级？

Answer 1

如果您要移除droplevels以外的levels，可以使用subset。

 traveler1 <- subset(traveler, User=="A")
 traveler1$Origin
 #[1] AGN AFR AUS AUS AFR
 #Levels: AFR AGN AUS Sing USA ZMB
  traveler2 <- droplevels(traveler1)
  traveler2$Origin
  #[1] AGN AFR AUS AUS AFR
  #Levels: AFR AGN AUS

数据

 set.seed(24)
 traveler <- data.frame(User=sample(LETTERS[1:5], 25, replace=TRUE),
   Origin=sample(c("AUS", "AFR", "AGN", "Sing", "USA", "ZMB"), 25, replace=TRUE),
 Destination=sample(c("AUS", "AFR", "JAP", "US", "CHINA", "Africa"), 25, replace=TRUE))

Answer 2

我们可以直接再次考虑该变量，而不是降低等级......

即..，

factor(user$Origin)

[1]唱美国

 2 Levels

默认情况下，它会再次分割水平。

感谢所有

在R中具有可变水平的Pbm

2 个答案:

数据