如何用R中的NA替换特定行和列中的某些值?

时间:2019-02-10 10:27:05

标签: r dplyr

在我的数据框中,我想用NA替换某些空白单元格和具有值的单元格。但是我要替换为NA的单元格与单元格存储的值无关,而是与行和列的组合存储在其中。

这是一个示例数据帧DF:

  Fruits   Price   Weight   Number of pieces

  Apples      20      2          10
  Oranges     15      4          16
  Pineapple   40      8           6
  Avocado     60      5          20

我想将Pineapple'e的重量替换为NA,将Orange的件数替换为NA。

DF$Weight[3] <- NA
DF$`Number of pieces`[2] <- NA  

这将替换存储在该位置并且可能会更改的任何值。我想使用特定的行和列名称进行替换,因此值的位置变得无关紧要。

输出:

 Fruits   Price   Weight   Number of pieces

  Apples      20      2          10
  Oranges     15      4          NA
  Pineapple   40      NA           6
  Avocado     60      5          20

但是,如果表的顺序更改了,这将用NA替换错误的值。

我应该怎么做?

3 个答案:

答案 0 :(得分:3)

这是使用函数is.na<-的一种方式。

is.na(DF$Weight) <- DF$Fruits == "Pineapple"
is.na(DF$`Number of pieces`) <- DF$Fruits == "Oranges"

DF
#     Fruits Price Weight Number of pieces
#1    Apples    20      2               10
#2   Oranges    15      4               NA
#3 Pineapple    40     NA                6
#4   Avocado    60      5               20

dput格式的数据。

DF <-
structure(list(Fruits = structure(c(1L, 3L, 4L, 2L), 
.Label = c("Apples", "Avocado", "Oranges", "Pineapple"), 
class = "factor"), Price = c(20L, 15L, 40L, 60L), 
Weight = c(2L, 4L, 8L, 5L), `Number of pieces` = c(10L, 
16L, 6L, 20L)), class = "data.frame", row.names = c(NA, -4L))

答案 1 :(得分:1)

由于数据结构是二维的,因此可以先找到包含特定值的行的索引,然后使用此信息。

which(DF$Fruits == "Pineapple")
[1]  3
DF$Weight[which(DF$Fruits == "Pineapple")] <- NA

您应该注意which将返回一个向量,因此,如果您有多个名为“ Pineapple”的水果,则上一条命令将返回它们的所有索引。

答案 2 :(得分:1)

private void Form1_Load(object sender, EventArgs e) {
  for (int i = 0; i < 10; i++) {
    dataGridView1.Rows.Add("C0R" + i, "C1R" + i, "C2R" + i);
  }
}

private void dataGridView1_SelectionChanged(object sender, EventArgs e) {
  int row = dataGridView1.CurrentCell.RowIndex;
  int col = dataGridView1.CurrentCell.ColumnIndex;
  List<string> surroundingCellsList = GetSurroundingCells(row, col);
  textBox1.Text = "--- Cell a row: " + row + " col: " + col + " Value: " + GetCellValue(row, col) + Environment.NewLine;
  foreach (string item in surroundingCellsList) {
    textBox1.Text += item + Environment.NewLine;
  }

结果:由于读取数据,件数被截断为Number。

library(dplyr)
df %>% 
  mutate(Weight=ifelse(Fruits=="Pineapple",NA,Weight),
         Number=ifelse(Fruits=="Oranges",NA,Number))#use Number of Pieces