Question

您好，感谢您的阅读。我在Windows 7操作系统上使用rStudio v3.1.2。

我正在开发一个Coursera项目，简而言之，要求我编写一个带有两个参数的函数：一个状态的2个字符的缩写名称和结果名称。这两个参数都表示我的数据中的特定列，我必须对该状态中的指定结果具有最佳（即最低）30天死亡率的医院名称进行子集，排序和返回字符向量。有关作业的更多详细信息，请访问以下链接： http://rstudio-pubs-static.s3.amazonaws.com/2104_db4f612f1f2c477b91c8a456fb014c9e.html

我遇到的问题是尝试仅对与相关州相关的数据进行子集化。剩下的必要代码不会产生错误并产生预期的结果，所以为了不发布可能被抄袭的代码，我只会介绍完成手头任务的版本。

## subset only data with specific state
   dataSlice <- subset(data, data$State == state)
   head(dataSlice)
## I've also tried
   dataSlice <- subset(data, state %in% data$State)
   head(dataSlice)

当我用：

调用该函数时

best("TX","heart attack")

两个结果似乎都给了我“AL”而不是“TX”的每一列的前6行，这让我相信数据根本不是子集，我只是获得前6行data（尝试子集之前的整个data.frame）。我会发布结果但是有47列，每行6行肯定会压倒页面。

首先，我想了解为什么会产生这样的结果，因为它似乎对我没有任何意义。如果在那之后，调整我的代码可以产生预期的结果，我怎么能够重写它？

如何按列值拆分/子集表格数据

0 个答案: