在R中具有可变水平的Pbm

时间:2014-10-17 05:34:21

标签: r analytics visualization

我有一个旅行者数据集,作为Origin国家有200个级别,目的地有相同的200个级别。从此我已经过滤掉了一个用户特定记录。 的exaple:

 User   Origin    Destination
 A        Sing       AUS
 A        Sing       JAP
 A        Sing       US
 A        Sing       CHINA
 A        USA        Africa

从这里我写了一个查询来探索变量值:

user$Origin

显示为

[1]  Sing  USA
200 levels : AUS,AFR,AGN........USA,ZMB.

我的问题是

如何更改等级?

2 个答案:

答案 0 :(得分:0)

如果您要移除droplevels以外的levels,可以使用subset

 traveler1 <- subset(traveler, User=="A")
 traveler1$Origin
 #[1] AGN AFR AUS AUS AFR
 #Levels: AFR AGN AUS Sing USA ZMB
  traveler2 <- droplevels(traveler1)
  traveler2$Origin
  #[1] AGN AFR AUS AUS AFR
  #Levels: AFR AGN AUS

数据

 set.seed(24)
 traveler <- data.frame(User=sample(LETTERS[1:5], 25, replace=TRUE),
   Origin=sample(c("AUS", "AFR", "AGN", "Sing", "USA", "ZMB"), 25, replace=TRUE),
 Destination=sample(c("AUS", "AFR", "JAP", "US", "CHINA", "Africa"), 25, replace=TRUE))

答案 1 :(得分:0)

我们可以直接再次考虑该变量,而不是降低等级......

即..,

factor(user$Origin)

[1]唱美国

 2 Levels

默认情况下,它会再次分割水平。

感谢所有