当使用下载的R软件包(例如“tm”)时,给定的示例通常会加载示例数据集,例如
data("crude")
我怎么知道这个数据集究竟是什么,以及哪种格式,矩阵或向量?只有知道这种信息,我才能将输入自定义为此包所需的格式。
答案 0 :(得分:5)
尝试?crude
,str(crude)
和summary(crude)
。
?crude
甚至会为您提供一些参考文献。
答案 1 :(得分:5)
除了使用帮助工具获取有关crude
的更多信息之外,我们还可以执行此操作:
# load crude into environment e
data(crude, verbose = TRUE, envir = e <- new.env())
# check what is in e
ls(e) # "crude"
# what is it?
class(e$crude)
summary(e$crude)
# we are satisfied that its what we want so remove e and load it into workspace
rm(e)
data(crude)
在上面的例子中,crude
数据集只包含一个也被称为crude
的对象,但情况并非总是如此。例如,state
数据集包含7个对象,但没有一个被称为state
:
# load state into environment e
data(state, verbose = TRUE, envir = e <- new.env())
# check what is in e
ls(e) # there are 7 objects in e