我做了问卷调查,其中一些答案是"我不知道"和"我不想回答"。现在我需要将这些回答选项更改为" N / A"这样他们就不会在我的统计数据中得到解释。我该怎么做?
答案 0 :(得分:0)
这很容易实现。我对您的数据做了一些假设,因为您没有提供格式。假设您在excel电子表格中包含数据,并使用以下代码将其导入R:
## Import Data ##
require("gdata")
myData <-read.xls("myData.xlsx", stringsAsFactors = FALSE)
好的,现在你在R中有一个名为myData
的数据框。我们假设有一个名为Answers
的列,其中包含作为字符串的响应。我们有一些很好的回答,一些NA值,还有一些说“我不知道”或“我不想回答”或类似的。
此代码会将以“我不”为开头的任何答案更改为NA。
myData$Answers[startsWith(myData$Answers,"I don't")] <- NA
或者您可以单独指定每个NA答案
(例如,如果有一些好的答案以“我不”开头)。
myData$Answers[myData$Answers == "I don't know")] <- NA
myData$Answers[myData$Answers == "I don't want to answer")] <- NA
或者您可以在对NA的回答中的任何位置更改包含特定词组的所有答案
myData$Answers[grepl("don't know", myData$Answers)] <- NA
如果您将字符串作为因子导入,那么上面的代码将会改变如下:
myData$Answers[grepl("don't know", levels(myData$Answers))] <- NA