R中的许多软件包中都包含内置数据集。(就像“mlbench”中的“Vehicle”和C50中的“churn”)我们可以使用data()
函数来加载这些数据集。有时,我想检查这些数据集的结构和内容,以构建新的数据集以供进一步分析。但view()
函数无法执行此作业,summary()
在某些情况下可能会使用,但如果您使用summary(churn)
,则唯一的结果是错误:Error in summary(churn) : 找不到对象'churn'
。
是否有任何常用方法可以显示内置数据集的一部分?
答案 0 :(得分:1)
尽管churn.Rdata位于C50库的../data/目录中,但加载它表明没有' churn'对象在里面。然而,有两个' churnTest'和' churnTrain'数据集,你可以用str():
看到它们的结构load('/path/to/my/current_R/Resources/library/C50/data/churn.RData')
ls(patt='churn')
#[1] "churnTest" "churnTrain"
str(churnTest)
'data.frame': 1667 obs. of 20 variables:
$ state : Factor w/ 51 levels "AK","AL","AR",..: 12 27 36 33 41 13 29 19 25 44 ...
$ account_length : int 101 137 103 99 108 117 63 94 138 128 ...
$ area_code : Factor w/ 3 levels "area_code_408",..: 3 3 1 2 2 2 2 1 3 2 ...
$ international_plan : Factor w/ 2 levels "no","yes": 1 1 1 1 1 1 1 1 1 1 ...
$ voice_mail_plan : Factor w/ 2 levels "no","yes": 1 1 2 1 1 1 2 1 1 2 ...
# snipped remainder of output
也会得到某种回应:
data(package="C50")
我得到一个弹出的面板:
Data sets in package ‘C50’:
churnTest (churn) Customer Churn Data
churnTrain (churn) Customer Churn Data