Question

我的问题涉及总结一个数据框，我应该删除所有空案例。我尝试使用na.rm但是没有用，因为没有值的行实际上写的是＆＃34; 不可用＆＃34;，然后我收到错误，因为缺失数据。看看我能做什么，我遇到了一个脚本，用户可以使用以下命令选择行：

filtered <- x[x$State==s & 
  x$Hospital.30.Day.Death..Mortality..Rates.from.Heart.Attack != 'Not Available', 
    c("Hospital.Name","Hospital.30.Day.Death..Mortality..Rates.from.Heart.Attack")]

我修正了如何选择＆＃34; 不可用＆＃34;的问题，但我并不了解==s的作用。有人可以向我解释一下吗？

Answer 1

这里有一些事情：

您的子集化操作一次完成三件事：
- 选择State变量等于变量s中存储的值的所有行（必须在此行运行之前设置;否则会出错）;这就是x$State == s ...
- 和（这是&运营商的意思）医院30天死亡率变量不缺失
- 和仅从数据集中选择医院名称和死亡率列（这是,之后的位）
如果您使用read.csv()或read.table()从文件中读取数据，则可以使用na.strings参数指定“不可用”应自动转换到R的缺失值NA
您可能想要重命名长命名变量（gdata，sjmisc，plyr和dplyr包中有方便的重命名功能：选择一个
您还可以使用基础R中的subset或filter中的select和dplyr来执行这些操作

在对数据进行子集化时，“== s”是什么意思？

1 个答案: