根据计算在数据框中插入行

时间:2017-05-03 05:47:50

标签: r dataframe rep

我是R的新手,我正在尝试将Excel中完成的计算复制到R. 我有一个这样的数据框:

Component <- c("A", "B", "C")
Report_Time <- c(5781, 5781, 5781)
Interval <- c(700, 600, 800)
End_Time <- c(8281, 8281, 8281)
Start_Time <- c(800, 298, 780)
df <- data.frame(Component, Report_Time, Interval, End_Time, Start_Time)

印刷时看起来像这样:

# Component Report_Time Interval    End_Time    Start_Time
#1    A         5781        700         8281        800
#2    B         5781        600         8281        298
#3    C         5781        800         8281        780

对于每个组件,我想填充计算列“Interval_Time”,它是First的开始时间+ Report_Time的总和,然后如果它小于End_Time,则插入一个Interval_Time(Last sum)之和的行+间隔。重复插入,直到Interval time中的和小于End_Time。

# Component Report_Time Interval    End_Time    Start_Time  Interval_Time
#1   A       5781       700             8281        800         6581
#2   A       5781       700             8281        800         7281
#3   A       5781       700             8281        800         7981
#4   B       5781       1000            8281        298         6079        
#5   B       5781       1000            8281        298         7079
#6   B       5781       1000            8281        298         8079
#7   C       5781       1200            8281        780         6561
#8   C       5781       1200            8281        780         7761

如果在for循环中,我一直试图实现这个目标..但是还没有成功。

3 个答案:

答案 0 :(得分:3)

使用data.table

Component <- c("A", "B", "C")
Report_Time <- c(5781, 5781, 5781)
Interval <- c(700, 1000, 1200)
End_Time <- c(8281, 8281, 8281)
Start_Time <- c(800, 298, 780)
df <- data.frame(Component, Report_Time, Interval, End_Time, Start_Time)

library(data.table)
setDT(df)
df<-df[rep(1:.N,ceiling((End_Time-Start_Time-Report_Time)/Interval))]
df[,Interval_Time:=ifelse(.I==1,Start_Time+Report_Time,Start_Time+cumsum(Interval)+Report_Time-Interval),by=.(Component)]

df
Component Report_Time Interval End_Time Start_Time Interval_Time
1:         A        5781      700     8281        800          6581
2:         A        5781      700     8281        800          7281
3:         A        5781      700     8281        800          7981
4:         B        5781     1000     8281        298          6079
5:         B        5781     1000     8281        298          7079
6:         B        5781     1000     8281        298          8079
7:         C        5781     1200     8281        780          6561
8:         C        5781     1200     8281        780          7761

答案 1 :(得分:0)

请检查此部分解决方案是否对您有用。如果你想继续添加,直到间隔时间小于End_T2ime,那么你还必须复制其他行。

Component <- c("A", "B", "C")
Report_Time <- c(5781, 5781, 5781)
Interval <- c(700, 600, 800)
End_Time <- c(8281, 8281, 8281)
Start_Time <- c(800, 298, 780)
df <- data.frame(Component, Report_Time, Interval, End_Time, Start_Time)

df$Interval_time[1]=df[1,2]+df[1,5]
for(i in 2:nrow(df))
{

  if((df[i,2]+df[i,5]) < df[i,4])
     df$Interval_time[i]=df$Interval_time[i-1]+df[i,3]
  else
    df$Interval_time[i]=df[i,2]+df[i,5]

}

答案 2 :(得分:0)

不像@Erden Akkas那样优雅,但是因为我还在研究它;)

注意,这种方法可以假设原始数据帧只是每个组件的一个观察值。

df$value <- df$Start_Time + df$Report_Time

for (i in 1:nrow(df))
{
  t <- df[i,]
  val <- t$value
  repeat {
    val <- val + t$Interval
    if (val > t$End_Time) {break}
    dftmp <- df[i,]
    dftmp$value <- val
    # Insert new Record
    df <- rbind(df, dftmp) 

   }
 }
 df[with(df, order(Component)), ]

但是,这显然是@Erden Akkas使用数据表库的程序性...但它无论如何都能完成工作......

   Component Report_Time Interval End_Time Start_Time value
1          A        5781      700     8281        800  6581
4          A        5781      700     8281        800  7281
5          A        5781      700     8281        800  7981
2          B        5781      600     8281        298  6079
21         B        5781      600     8281        298  6679
22         B        5781      600     8281        298  7279
23         B        5781      600     8281        298  7879
3          C        5781      800     8281        780  6561
31         C        5781      800     8281        780  7361
32         C        5781      800     8281        780  8161