如何从R中列的每个值中减去数据帧中特定位置的数字

时间:2019-11-21 18:18:48

标签: r dataframe difference tibble

我有一个包含216行和12列的数据框,并且我尝试添加一个新列,其中每个值等于第12列中的每个元素与第216行,第12列中的元素的值之差(df [216,12])。当我尝试使用简化版本的数据框(即仅用5列而不是216列)来执行此操作时,没有问题,但是现在我试图对整个数据集执行确切的操作,这给我一个错误,说“ Ops.data.frame(df_final [,12],df_final [216,12])中的错误:“-”仅针对大小相等的数据帧定义。”不知道为什么会收到该错误或如何解决该错误。

出于说明目的,我的数据集的简化版本如下(该代码适用于该简化的数据集,但不适用于我的具有216行而不是5行的完整数据集):

miRNA<-c("hsa-miR-10a-4373153", "hsa-miR-10b-4395329", "MammU6-4395470_1", "MammU6-4395470_2", "hsa-miR-15a-4373123")
C1<-c(28.005966, 30.806433, 17.341375, 17.40666, 30.039436)
T2<-c(30.973469, 29.236025, 30.41161, 20.914383, 20.904331)
C3<-c(26.322796, 25.542833, 22.460772, 19.972183, 30.409641)
T4<-c(26.441898, 25.837685, 23.158352, 20.379173, 33.81327)
C5<-c(39.750206, 19.901133, 28.180124, 22.668673, 25.748884)
T6<-c(23.004385, 28.472675, 23.81621, 26.433413, 28.851719)
T7<-c(22.239546, 28.741674, 23.754929, 26.015385, 28.16368)
T8<-c(29.590443, 30.041988, 21.323061, 24.272501, 18.099016)
C9<-c(15.856442, 22.64224, 29.629637, 25.374926, 22.356894)
C10<-c(38.137985, 24.753338, 26.986668, 24.578161, 19.223558)
data<-data.frame(miRNA, C1, T2, C3, T4, C5, T6, T7, T8, C9, C10)
View(data)
data$C12<-data[,11]-data[5,11]

1 个答案:

答案 0 :(得分:2)

问题在于它是tbl_df。与data.frame不同,data[,11]不会折叠为vector。它仍然是带有单列的tbl_df。有很多选择

unlist(data[,11])- unlist(data[5,11])

使用可复制的示例

df1 <- tibble(col1 = 1:5, col2 = 6:10)
df1[, 2] - df1[1, 2]
  

Ops.data.frame(df1 [,2],df1 [1,2])中的错误:         “-”仅适用于大小相等的数据帧

unlist(df1[,2]) - unlist(df1[1,2])

或者使用drop = TRUE(默认情况下,FALSE的标题为whereas in data.frame , it is是`

df1[[2]] - df1[1,2, drop = TRUE]

请注意,我们使用[[将列提取为vector

或者另一个选择是利用dplyr函数

library(dplyr)
df1 %>%
    mutate_at(2, ~ . - .[2])