如何在R中查看“成人”数据集的行和列

时间:2018-11-07 07:05:46

标签: r

如何在R中查看“成人”数据集的行和列?我刚开始学习R。 感谢您的帮助。请参考screenhot enter image description here

2 个答案:

答案 0 :(得分:1)

首先,从运行str开始,查看数据集的 str 结构。

str(Adult)
#Formal class 'transactions' [package "arules"] with 3 slots
#  ..@ data       :Formal class 'ngCMatrix' [package "Matrix"] with #5 slots
#  .. .. ..@ i       : int [1:612200] 1 10 25 32 35 50 59 61 63 65 #...
#  .. .. ..@ p       : int [1:48843] 0 13 26 39 52 65 78 91 104 117 #...
#  .. .. ..@ Dim     : int [1:2] 115 48842
#  .. .. ..@ Dimnames:List of 2
#  .. .. .. ..$ : NULL
#  .. .. .. ..$ : NULL
#  .. .. ..@ factors : list()
#  ..@ itemInfo   :'data.frame':    115 obs. of  3 variables:
#  .. ..$ labels   : chr [1:115] "age=Young" "age=Middle-aged" #"age=Senior" "age=Old" ...
#  .. ..$ variables: Factor w/ 13 levels "age","capital-gain",..: 1 #1 1 1 13 13 13 13 13 13 ...
#  .. ..$ levels   : Factor w/ 112 levels "10th","11th",..: 111 63 #92 69 30 54 65 82 90 91 ...
#  ..@ itemsetInfo:'data.frame':    48842 obs. of  1 variable:
#  .. ..$ transactionID: chr [1:48842] "1" "2" "3" "4" ...

这告诉您Adult是具有三个插槽dataitemInfoitemsetInfo的S4对象。

  1. 插槽data是由软件包Matrix创建的稀疏矩阵;
  2. 插槽itemInfodata.frame
  3. 插槽itemsetInfo也是data.frame

S4对象的插槽可通过运算符@访问。为了查看这些插槽中的内容,请运行

Adult@data
Adult@itemInfo
Adult@itemsetInfo

对于两个数据框,您可能更喜欢运行

head(Adult@itemInfo)
head(Adult@itemsetInfo)

由于它们分别具有115和48842个观测值,因此不适合屏幕显示。

答案 1 :(得分:0)

要获得示例中显示的文本输出,可以使用以下代码:

cat(dim(mtcars)[1], "transactions (rows)\n", dim(mtcars)[2], "items (cols)")
#32 transactions (rows)
# 11 items (cols)

mtcars(或任何Adult)更改data.framecat可让您打印到控制台,而dim()可让您获取数据的行和列。

类似于从基础strR的情况,您可以从glimpse包中使用dplyr

install.packages("dplyr") # run this the first time to install the package
dplyr::glimpse(mtcars)

# Observations: 32
# Variables: 11
# $ mpg  <dbl> 21.0, 21.0, 22.8, 21.4, 18.7, 18.1, 14.3, 24.4, 22.8, 19.2, 17.8, 16.4, 17.3, 15.2, 10.4, 10.4, 14.7, 32...
# $ cyl  <dbl> 6, 6, 4, 6, 8, 6, 8, 4, 4, 6, 6, 8, 8, 8, 8, 8, 8, 4, 4, 4, 4, 8, 8, 8, 8, 4, 4, 4, 8, 6, 8, 4
# $ disp <dbl> 160.0, 160.0, 108.0, 258.0, 360.0, 225.0, 360.0, 146.7, 140.8, 167.6, 167.6, 275.8, 275.8, 275.8, 472.0,...
# $ hp   <dbl> 110, 110, 93, 110, 175, 105, 245, 62, 95, 123, 123, 180, 180, 180, 205, 215, 230, 66, 52, 65, 97, 150, 1...
# $ drat <dbl> 3.90, 3.90, 3.85, 3.08, 3.15, 2.76, 3.21, 3.69, 3.92, 3.92, 3.92, 3.07, 3.07, 3.07, 2.93, 3.00, 3.23, 4....
# $ wt   <dbl> 2.620, 2.875, 2.320, 3.215, 3.440, 3.460, 3.570, 3.190, 3.150, 3.440, 3.440, 4.070, 3.730, 3.780, 5.250,...
# $ qsec <dbl> 16.46, 17.02, 18.61, 19.44, 17.02, 20.22, 15.84, 20.00, 22.90, 18.30, 18.90, 17.40, 17.60, 18.00, 17.98,...
# $ vs   <dbl> 0, 0, 1, 1, 0, 1, 0, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1
# $ am   <dbl> 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1
# $ gear <dbl> 4, 4, 4, 3, 3, 3, 3, 4, 4, 4, 4, 3, 3, 3, 3, 3, 3, 4, 4, 4, 3, 3, 3, 3, 3, 4, 5, 5, 5, 5, 5, 4
# $ carb <dbl> 4, 4, 1, 1, 2, 1, 4, 2, 2, 4, 4, 3, 3, 3, 4, 4, 4, 1, 2, 1, 1, 2, 2, 4, 2, 1, 2, 2, 4, 6, 8, 2

您有“观察值”(行)和“变量”(列)的数量,并列出了每个变量的格式类型和值。