我正在尝试清理包含一些无效条目的美国州字段,因此我可以强制使用50个级别的因子并为每个州创建虚拟变量。
以此示例数据框为例:
ID State
1 1 PA
2 2 <NA>
3 3 MD
4 4 VA
5 5 VD
我想删除任何有效的美国州缩写值(&#34; VD&#34;在此示例中),并将其替换为NA。
我试过了:
df$State[df$State!=one_of(state.abb)] <- NA
但它返回:
Error: Variable context not set
任何帮助将不胜感激!
答案 0 :(得分:0)
df$State[!(df$State %in% state.abb)] <- NA
@Jaap提供的答案