如何在R中查看“成人”数据集的行和列?我刚开始学习R。 感谢您的帮助。请参考screenhot enter image description here
答案 0 :(得分:1)
首先,从运行str
开始,查看数据集的 str 结构。
str(Adult)
#Formal class 'transactions' [package "arules"] with 3 slots
# ..@ data :Formal class 'ngCMatrix' [package "Matrix"] with #5 slots
# .. .. ..@ i : int [1:612200] 1 10 25 32 35 50 59 61 63 65 #...
# .. .. ..@ p : int [1:48843] 0 13 26 39 52 65 78 91 104 117 #...
# .. .. ..@ Dim : int [1:2] 115 48842
# .. .. ..@ Dimnames:List of 2
# .. .. .. ..$ : NULL
# .. .. .. ..$ : NULL
# .. .. ..@ factors : list()
# ..@ itemInfo :'data.frame': 115 obs. of 3 variables:
# .. ..$ labels : chr [1:115] "age=Young" "age=Middle-aged" #"age=Senior" "age=Old" ...
# .. ..$ variables: Factor w/ 13 levels "age","capital-gain",..: 1 #1 1 1 13 13 13 13 13 13 ...
# .. ..$ levels : Factor w/ 112 levels "10th","11th",..: 111 63 #92 69 30 54 65 82 90 91 ...
# ..@ itemsetInfo:'data.frame': 48842 obs. of 1 variable:
# .. ..$ transactionID: chr [1:48842] "1" "2" "3" "4" ...
这告诉您Adult
是具有三个插槽data
,itemInfo
和itemsetInfo
的S4对象。
data
是由软件包Matrix
创建的稀疏矩阵; itemInfo
是data.frame
; itemsetInfo
也是data.frame
。 S4对象的插槽可通过运算符@
访问。为了查看这些插槽中的内容,请运行
Adult@data
Adult@itemInfo
Adult@itemsetInfo
对于两个数据框,您可能更喜欢运行
head(Adult@itemInfo)
head(Adult@itemsetInfo)
由于它们分别具有115和48842个观测值,因此不适合屏幕显示。
答案 1 :(得分:0)
要获得示例中显示的文本输出,可以使用以下代码:
cat(dim(mtcars)[1], "transactions (rows)\n", dim(mtcars)[2], "items (cols)")
#32 transactions (rows)
# 11 items (cols)
用mtcars
(或任何Adult
)更改data.frame
。 cat
可让您打印到控制台,而dim()
可让您获取数据的行和列。
类似于从基础str
到R
的情况,您可以从glimpse
包中使用dplyr
:
install.packages("dplyr") # run this the first time to install the package
dplyr::glimpse(mtcars)
# Observations: 32
# Variables: 11
# $ mpg <dbl> 21.0, 21.0, 22.8, 21.4, 18.7, 18.1, 14.3, 24.4, 22.8, 19.2, 17.8, 16.4, 17.3, 15.2, 10.4, 10.4, 14.7, 32...
# $ cyl <dbl> 6, 6, 4, 6, 8, 6, 8, 4, 4, 6, 6, 8, 8, 8, 8, 8, 8, 4, 4, 4, 4, 8, 8, 8, 8, 4, 4, 4, 8, 6, 8, 4
# $ disp <dbl> 160.0, 160.0, 108.0, 258.0, 360.0, 225.0, 360.0, 146.7, 140.8, 167.6, 167.6, 275.8, 275.8, 275.8, 472.0,...
# $ hp <dbl> 110, 110, 93, 110, 175, 105, 245, 62, 95, 123, 123, 180, 180, 180, 205, 215, 230, 66, 52, 65, 97, 150, 1...
# $ drat <dbl> 3.90, 3.90, 3.85, 3.08, 3.15, 2.76, 3.21, 3.69, 3.92, 3.92, 3.92, 3.07, 3.07, 3.07, 2.93, 3.00, 3.23, 4....
# $ wt <dbl> 2.620, 2.875, 2.320, 3.215, 3.440, 3.460, 3.570, 3.190, 3.150, 3.440, 3.440, 4.070, 3.730, 3.780, 5.250,...
# $ qsec <dbl> 16.46, 17.02, 18.61, 19.44, 17.02, 20.22, 15.84, 20.00, 22.90, 18.30, 18.90, 17.40, 17.60, 18.00, 17.98,...
# $ vs <dbl> 0, 0, 1, 1, 0, 1, 0, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1
# $ am <dbl> 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1
# $ gear <dbl> 4, 4, 4, 3, 3, 3, 3, 4, 4, 4, 4, 3, 3, 3, 3, 3, 3, 4, 4, 4, 3, 3, 3, 3, 3, 4, 5, 5, 5, 5, 5, 4
# $ carb <dbl> 4, 4, 1, 1, 2, 1, 4, 2, 2, 4, 4, 3, 3, 3, 4, 4, 4, 1, 2, 1, 1, 2, 2, 4, 2, 1, 2, 2, 4, 6, 8, 2
您有“观察值”(行)和“变量”(列)的数量,并列出了每个变量的格式类型和值。