R根据原始行附加新行

时间:2017-04-17 09:45:38

标签: r append row data-manipulation

我是R的新手,我希望根据原始行添加大量新行 首先,我展示了我的部分数据:

Type    Time            PM
Ac      2016-01         7710
Ac      2016-02         27500
Ac      2016-03         12840
Ac      2016-04         20060
Ac      2016-05         9430
Ac      2016-06         9830
Ac      2016-07         3870
Ac      2016-08         12040
Ac      2016-09         5590
Ac      2016-10         4300
Ac      2016-11         3870
Ac      2016-12         2580
As      2016-01         315052
As      2016-02         478542
As      2016-03         491472
As      2016-04         662238
As      2016-05         464728
As      2016-06         530424
As      2016-07         443122
As      2016-08         603512
As      2016-09         564438
As      2016-10         440068
As      2016-11         462846
As      2016-12         525394
HW      2015-12           7250

其次,我想要的就是跟随(我将Type AcTime 2016-01 & 2016-03 & 2016-10作为例子):

Type    Time    Time2   LapseMonth  PM      What I want
Ac  2016-01     2016-01     0       7710    315.9836066
Ac  2016-01     2016-02     1       0       610.9016393
Ac  2016-01     2016-03     2       0       653.0327869
Ac  2016-01     2016-04     3       0       631.9672131
Ac  2016-01     2016-05     4       0       653.0327869
Ac  2016-01     2016-06     5       0       631.9672131
Ac  2016-01     2016-07     6       0       653.0327869
Ac  2016-01     2016-08     7       0       653.0327869
Ac  2016-01     2016-09     8       0       631.9672131
Ac  2016-01     2016-10     9       0       653.0327869
Ac  2016-01     2016-11     10      0       631.9672131
Ac  2016-01     2016-12     11      0       653.0327869
Ac  2016-03     2016-03     0       12840   526.2295082
Ac  2016-03     2016-04     1       0       1052.459016
Ac  2016-03     2016-05     2       0       1087.540984
Ac  2016-03     2016-06     3       0       1052.459016
Ac  2016-03     2016-07     4       0       1087.541
Ac  2016-03     2016-08     5       0       1087.541
Ac  2016-03     2016-09     6       0       1052.459
Ac  2016-03     2016-10     7       0       1087.541
Ac  2016-03     2016-11     8       0       1052.459
Ac  2016-03     2016-12     9       0       1087.541
Ac  2016-10     2016-10     0       4300    176.2295082
Ac  2016-10     2016-11     1       0       352.4590164
Ac  2016-10     2016-12     2       0       364.2076503

我解释我想要的结果:
1. Time2是一个新列,它是月份相等且在Time之后 2. LapseMonth也是一个新列,等于月(Time2) - 月(Time)。因此,它如上所述产生 3. What I want列很复杂    请看第1行(Time:2016-01,Time2:2016-01,LapseMonth:0,PM:7710,What I want:315.9836066)
   当Time = Time1时,What I want的公式为 15/366 * PM ,其中PM = 7710
   以下是该月的 / 366 * PM(即第2行:610.9016393 = 29/366 * 7710,riow3:653.0327869 = 31/366 * 7710)

我逐行添加每一行,但是当有很多type时效率很低 我想也许我可以使用for-loopifelse来弄明白。但是,我仍然不知道如何开始。

我在下面添加我的代码。由于我的数据包含多个excel,所以我一次读取它:

library(readxl)
library(data.table)
library(lubridate)
file.list <- dir(path = "filename", pattern='\\.xlsx', full.names = T)
df.list <- lapply(file.list, read_excel)
df <- rbindlist(df.list)
df<-as.data.table(df)
df[,Time:=as.Date(Time,"%Y-%m")]  

Time格式更改为日期,但所有值都缺失。这是怎么回事? [已解决]

df$Time <- ymd( paste( df$Time, 01, sep = "-"))

然后查看@Erdem Akkas的答案并运行代码。

有些非常特别。
看看我的最后一个障碍。数据:HW 2015-12 7250
Time 2015 时,我需要的结果与 2016 中的Time不同。
我想要的是如下:

Type    Time    Time2   LapseMonth  PM      What I want
HW   2015-12    2015-12      0      7250    297.1311475
HW   2015-12    2016-01      1      0       614.0710382
HW   2015-12    2016-02      2      0       574.4535519
HW   2015-12    2016-03      3      0       614.0710382
HW   2015-12    2016-04      4      0       594.2622951
HW   2015-12    2016-05      5      0       614.0710382
HW   2015-12    2016-06      6      0       594.2622951
HW   2015-12    2016-07      7      0       614.0710382
HW   2015-12    2016-08      8      0       614.0710382
HW   2015-12    2016-09      9      0       594.2622951
HW   2015-12    2016-10      10     0       614.0710382
HW   2015-12    2016-11      11     0       594.2622951
HW   2015-12    2016-12      12     0       316.9398907

以上是2015年的TimeWhat I want我确实需要 我知道这很复杂,所以我在下面解释一下 1.当Time 2015 时,无论哪个月,LapseMonthTime 2016 时都不一样。 2015年LapseMonthTime必须为0~12。(见上文)
2.列What I want与2016年Time时的计算方法相同。但是,有一个特例。当LapseMonth等于 12 时,What I want = 0时,What I want的值为原始值减去LapseMonth的值。这很奇怪。
   此示例中的原始值为614.0710382,因为Dec有31天。因此,614.0710382 = PM * 31/366 = 7250 * 31/366    当What I want等于 12 时,LapseMonth的值为614.0710382 - 297.1311475。

1 个答案:

答案 0 :(得分:2)

使用data.table

library(data.table)
library(lubridate)

df<-read.table(text="Type    Time            PM
           Ac      2016/1/1    7710
           Ac      2016/2/1    27500
           Ac      2016/3/1    12840
           Ac      2016/4/1    20060
           Ac      2016/5/1    9430
           Ac      2016/6/1    9830
           Ac      2016/7/1    3870
           Ac      2016/8/1    12040
           Ac      2016/9/1    5590
           Ac      2016/10/1   4300
           Ac      2016/11/1   3870
           Ac      2016/12/1   2580
           As      2016/1/1    315052
           As      2016/2/1    478542
           As      2016/3/1    491472
           As      2016/4/1    662238
           As      2016/5/1    464728
           As      2016/6/1    530424
           As      2016/7/1    443122
           As      2016/8/1    603512
           As      2016/9/1    564438
           As      2016/10/1   440068
           As      2016/11/1   462846
           As      2016/12/1   525394",header=T)

dt<-as.data.table(df)
dt[,Time:=as.Date(Time,"%Y/%m/%d")]
dtapp<-dt[rep(1:.N,12-month(Time)+1)]
dtapp[,LapseMonth := seq_len(.N)-1, by =.(Type,Time,PM) ]
dtapp[,Time2:=Time-days(mday(Time)-1)+months(LapseMonth)]
dtapp[,`What I want`:=ifelse(Time==Time2,PM*15/366,PM*days_in_month(Time2)/366)]

dtapp
Type       Time     PM LapseMonth      Time2 What I want
1:   Ac 2016-01-01   7710          0 2016-01-01     315.984
2:   Ac 2016-01-01   7710          1 2016-02-01     610.902
3:   Ac 2016-01-01   7710          2 2016-03-01     653.033
4:   Ac 2016-01-01   7710          3 2016-04-01     631.967
5:   Ac 2016-01-01   7710          4 2016-05-01     653.033
---                                                         
152:   As 2016-10-01 440068          1 2016-11-01   36071.148
153:   As 2016-10-01 440068          2 2016-12-01   37273.519
154:   As 2016-11-01 462846          0 2016-11-01   18969.098
155:   As 2016-11-01 462846          1 2016-12-01   39202.803
156:   As 2016-12-01 525394          0 2016-12-01   21532.541