如何揭示内置数据集的内容?

时间:2016-10-02 07:48:28

标签: r dataset

R中的许多软件包中都包含内置数据集。(就像“mlbench”中的“Vehicle”和C50中的“churn”)我们可以使用data()函数来加载这些数据集。有时,我想检查这些数据集的结构和内容,以构建新的数据集以供进一步分析。但view()函数无法执行此作业,summary()在某些情况下可能会使用,但如果您使用summary(churn),则唯一的结果是错误:Error in summary(churn) : 找不到对象'churn' 。 是否有任何常用方法可以显示内置数据集的一部分?

1 个答案:

答案 0 :(得分:1)

尽管churn.Rdata位于C50库的../data/目录中,但加载它表明没有' churn'对象在里面。然而,有两个' churnTest'和' churnTrain'数据集,你可以用str():

看到它们的结构
load('/path/to/my/current_R/Resources/library/C50/data/churn.RData')
ls(patt='churn')
#[1] "churnTest"  "churnTrain"
 str(churnTest)

'data.frame':   1667 obs. of  20 variables:
 $ state                        : Factor w/ 51 levels "AK","AL","AR",..: 12 27 36 33 41 13 29 19 25 44 ...
 $ account_length               : int  101 137 103 99 108 117 63 94 138 128 ...
 $ area_code                    : Factor w/ 3 levels "area_code_408",..: 3 3 1 2 2 2 2 1 3 2 ...
 $ international_plan           : Factor w/ 2 levels "no","yes": 1 1 1 1 1 1 1 1 1 1 ...
 $ voice_mail_plan              : Factor w/ 2 levels "no","yes": 1 1 2 1 1 1 2 1 1 2 ...
# snipped remainder of output

也会得到某种回应:

data(package="C50")

我得到一个弹出的面板:

Data sets in package ‘C50’:

churnTest (churn)      Customer Churn Data
churnTrain (churn)     Customer Churn Data