在对数据进行子集化时,“== s”是什么意思?

时间:2017-06-30 22:28:20

标签: r

我的问题涉及总结一个数据框,我应该删除所有空案例。我尝试使用na.rm但是没有用,因为没有值的行实际上写的是" 不可用",然后我收到错误,因为缺失数据。 看看我能做什么,我遇到了一个脚本,用户可以使用以下命令选择行:

filtered <- x[x$State==s & 
  x$Hospital.30.Day.Death..Mortality..Rates.from.Heart.Attack != 'Not Available', 
    c("Hospital.Name","Hospital.30.Day.Death..Mortality..Rates.from.Heart.Attack")]

我修正了如何选择&#34; 不可用&#34;的问题,但我并不了解==s的作用。有人可以向我解释一下吗?

1 个答案:

答案 0 :(得分:3)

这里有一些事情:

  • 您的子集化操作一次完成三件事:

    • 选择State变量等于变量s中存储的值的所有行(必须在此行运行之前设置;否则会出错);这就是x$State == s ...
    • 的含义
    • (这是&运营商的意思)医院30天死亡率变量不缺失
    • 仅从数据集中选择医院名称和死亡率列(这是,之后的位)
  • 如果您使用read.csv()read.table()从文件中读取数据,则可以使用na.strings参数指定“不可用”应自动转换到R的缺失值NA

  • 您可能想要重命名长命名变量(gdatasjmiscplyrdplyr包中有方便的重命名功能:选择一个
  • 您还可以使用基础R中的subsetfilter中的selectdplyr来执行这些操作
相关问题