应用一个函数,该函数使用数据框中的列作为1:n列和行上每个值的输入

时间:2017-10-16 13:30:17

标签: r dplyr apply

我试图将两个简单的函数分两步应用于矩阵中的1:n列的所有行或df,其中我想使用最后一列中的值作为函数中的输入。 这个问题可能重复,但我找不到我想要的解决方案。我已经尝试过编写一个函数,apply和dplyr函数,但是每个地方都会遇到如何引用特定列并获得x,y的每个组合的单独结果。

我已在[how to apply a function to every row of a matrix (or a data frame) in R和此处查看了答案:

但是这些操作主要是行或列,我需要函数来处理每个观察,即

这是我的数据的简化示例 - 但我的数据框在变量和长度方面具有不同的长度,因为我正在测量可变深度的深度剖面。

第一个期望的功能:

df<- matrix(c( 
      1.11543500, 1.09273900, 1.09362300, 1.09073300, 1.09668300, 0.0876387143,
      1.08729500, 1.06946100, 1.06227900, 1.06633600, 1.06690000, 0.0853604143,
      1.05458300, 1.03921000, 1.03225300, 1.03782000, 1.03416200, 0.0790749429,
      1.02783210, 1.01204520, 1.00525750, 1.00781250, 1.00666170,  0.0756004571
    ), nrow = 4, byrow = TRUE)

首先,我需要使用宽格式的df来应用类似的函数;

对于V1的每一行:V5减去V6,这将得到这样的输出(可以将V6保留为:

 df1
       V1         V2          V3          V4           V5          V6
1 1.027796286   1.005100286 1.005984286 1.003094286 1.009044286 0.087638714
2 1.001934586   0.984100586 0.976918586 0.980975586 0.981539586 0.085360414
3 0.975508057   0.960135057 0.953178057 0.958745057 0.955087057 0.079074943
4 0.952231643   0.936444743 0.929657043 0.932212043 0.931061243 0.075600457

我试过了:

    df1<- apply(df, 1, function(x) x[1:5]-x[6])

它给了我这个,这是错误的:

df1    [,1]      [,2]      [,3]      [,4]
 [1,] 1.027796 1.0019346 0.9755081 0.9522316
 [2,] 1.005100 0.9841006 0.9601351 0.9364447
 [3,] 1.005984 0.9769186 0.9531781 0.9296570
 [4,] 1.003094 0.9809756 0.9587451 0.9322120
 [5,] 1.009044 0.9815396 0.9550871 0.9310612

有人建议如何更正代码?我也愿意接受例如dplyr或函数调用的建议。

我希望它也会给我一个关于如何继续下一步的答案,我将不得不转换第一次计算的结果并添加一些其他具有临界值和盐度值的列以及常量通过如下公式计算:

  x = z- [constant_t * (t1 - t2) + constant_s * S]

其中z是第一次计算的输出。

1 个答案:

答案 0 :(得分:0)

您可以使用mutate_at中的dplyr来执行此操作。我使用ncol来确定要使用的列。然后,您可以使用t(),因为@PoGibas建议继续下一步。

library(dplyr)
df <- as_tibble(df) 
df1 <- mutate_at(df, 1:(ncol(df) -1), funs(. - df[[ncol(df)]]))
df1
#> # A tibble: 4 x 6
#>          V1        V2        V3        V4        V5         V6
#>       <dbl>     <dbl>     <dbl>     <dbl>     <dbl>      <dbl>
#> 1 1.0277963 1.0051003 1.0059843 1.0030943 1.0090443 0.08763871
#> 2 1.0019346 0.9841006 0.9769186 0.9809756 0.9815396 0.08536041
#> 3 0.9755081 0.9601351 0.9531781 0.9587451 0.9550871 0.07907494
#> 4 0.9522316 0.9364447 0.9296570 0.9322120 0.9310612 0.07560046

t(df1)
#>          [,1]       [,2]       [,3]       [,4]
#> V1 1.02779629 1.00193459 0.97550806 0.95223164
#> V2 1.00510029 0.98410059 0.96013506 0.93644474
#> V3 1.00598429 0.97691859 0.95317806 0.92965704
#> V4 1.00309429 0.98097559 0.95874506 0.93221204
#> V5 1.00904429 0.98153959 0.95508706 0.93106124
#> V6 0.08763871 0.08536041 0.07907494 0.07560046

如果您希望从结果中删除最后一个变量,则可以使用transmute_at代替mutate_at

transmute_at(df, 1:(ncol(df) -1), funs(. - df[[ncol(df)]]))

#> # A tibble: 4 x 5
#>          V1        V2        V3        V4        V5
#>       <dbl>     <dbl>     <dbl>     <dbl>     <dbl>
#> 1 1.0277963 1.0051003 1.0059843 1.0030943 1.0090443
#> 2 1.0019346 0.9841006 0.9769186 0.9809756 0.9815396
#> 3 0.9755081 0.9601351 0.9531781 0.9587451 0.9550871
#> 4 0.9522316 0.9364447 0.9296570 0.9322120 0.9310612