如何按列值拆分/子集表格数据

时间:2015-11-01 03:32:44

标签: r split subset

您好,感谢您的阅读。我在Windows 7操作系统上使用rStudio v3.1.2。

我正在开发一个Coursera项目,简而言之,要求我编写一个带有两个参数的函数:一个状态的2个字符的缩写名称和结果名称。这两个参数都表示我的数据中的特定列,我必须对该状态中的指定结果具有最佳(即最低)30天死亡率的医院名称进行子集,排序和返回字符向量。有关作业的更多详细信息,请访问以下链接: http://rstudio-pubs-static.s3.amazonaws.com/2104_db4f612f1f2c477b91c8a456fb014c9e.html

我遇到的问题是尝试仅对与相关州相关的数据进行子集化。剩下的必要代码不会产生错误并产生预期的结果,所以为了不发布可能被抄袭的代码,我只会介绍完成手头任务的版本。

## subset only data with specific state
   dataSlice <- subset(data, data$State == state)
   head(dataSlice)
## I've also tried
   dataSlice <- subset(data, state %in% data$State)
   head(dataSlice)

当我用:

调用该函数时
best("TX","heart attack")

两个结果似乎都给了我“AL”而不是“TX”的每一列的前6行,这让我相信数据根本不是子集,我只是获得前6行data(尝试子集之前的整个data.frame)。我会发布结果但是有47列,每行6行肯定会压倒页面。

首先,我想了解为什么会产生这样的结果,因为它似乎对我没有任何意义。如果在那之后,调整我的代码可以产生预期的结果,我怎么能够重写它?

0 个答案:

没有答案