我是R的新手,我正在尝试将Excel中完成的计算复制到R. 我有一个这样的数据框:
Component <- c("A", "B", "C")
Report_Time <- c(5781, 5781, 5781)
Interval <- c(700, 600, 800)
End_Time <- c(8281, 8281, 8281)
Start_Time <- c(800, 298, 780)
df <- data.frame(Component, Report_Time, Interval, End_Time, Start_Time)
印刷时看起来像这样:
# Component Report_Time Interval End_Time Start_Time
#1 A 5781 700 8281 800
#2 B 5781 600 8281 298
#3 C 5781 800 8281 780
对于每个组件,我想填充计算列“Interval_Time”,它是First的开始时间+ Report_Time的总和,然后如果它小于End_Time,则插入一个Interval_Time(Last sum)之和的行+间隔。重复插入,直到Interval time中的和小于End_Time。
# Component Report_Time Interval End_Time Start_Time Interval_Time
#1 A 5781 700 8281 800 6581
#2 A 5781 700 8281 800 7281
#3 A 5781 700 8281 800 7981
#4 B 5781 1000 8281 298 6079
#5 B 5781 1000 8281 298 7079
#6 B 5781 1000 8281 298 8079
#7 C 5781 1200 8281 780 6561
#8 C 5781 1200 8281 780 7761
如果在for循环中,我一直试图实现这个目标..但是还没有成功。
答案 0 :(得分:3)
使用data.table
:
Component <- c("A", "B", "C")
Report_Time <- c(5781, 5781, 5781)
Interval <- c(700, 1000, 1200)
End_Time <- c(8281, 8281, 8281)
Start_Time <- c(800, 298, 780)
df <- data.frame(Component, Report_Time, Interval, End_Time, Start_Time)
library(data.table)
setDT(df)
df<-df[rep(1:.N,ceiling((End_Time-Start_Time-Report_Time)/Interval))]
df[,Interval_Time:=ifelse(.I==1,Start_Time+Report_Time,Start_Time+cumsum(Interval)+Report_Time-Interval),by=.(Component)]
df
Component Report_Time Interval End_Time Start_Time Interval_Time
1: A 5781 700 8281 800 6581
2: A 5781 700 8281 800 7281
3: A 5781 700 8281 800 7981
4: B 5781 1000 8281 298 6079
5: B 5781 1000 8281 298 7079
6: B 5781 1000 8281 298 8079
7: C 5781 1200 8281 780 6561
8: C 5781 1200 8281 780 7761
答案 1 :(得分:0)
请检查此部分解决方案是否对您有用。如果你想继续添加,直到间隔时间小于End_T2ime,那么你还必须复制其他行。
Component <- c("A", "B", "C")
Report_Time <- c(5781, 5781, 5781)
Interval <- c(700, 600, 800)
End_Time <- c(8281, 8281, 8281)
Start_Time <- c(800, 298, 780)
df <- data.frame(Component, Report_Time, Interval, End_Time, Start_Time)
df$Interval_time[1]=df[1,2]+df[1,5]
for(i in 2:nrow(df))
{
if((df[i,2]+df[i,5]) < df[i,4])
df$Interval_time[i]=df$Interval_time[i-1]+df[i,3]
else
df$Interval_time[i]=df[i,2]+df[i,5]
}
答案 2 :(得分:0)
不像@Erden Akkas那样优雅,但是因为我还在研究它;)
注意,这种方法可以假设原始数据帧只是每个组件的一个观察值。
df$value <- df$Start_Time + df$Report_Time
for (i in 1:nrow(df))
{
t <- df[i,]
val <- t$value
repeat {
val <- val + t$Interval
if (val > t$End_Time) {break}
dftmp <- df[i,]
dftmp$value <- val
# Insert new Record
df <- rbind(df, dftmp)
}
}
df[with(df, order(Component)), ]
但是,这显然是@Erden Akkas使用数据表库的程序性...但它无论如何都能完成工作......
Component Report_Time Interval End_Time Start_Time value
1 A 5781 700 8281 800 6581
4 A 5781 700 8281 800 7281
5 A 5781 700 8281 800 7981
2 B 5781 600 8281 298 6079
21 B 5781 600 8281 298 6679
22 B 5781 600 8281 298 7279
23 B 5781 600 8281 298 7879
3 C 5781 800 8281 780 6561
31 C 5781 800 8281 780 7361
32 C 5781 800 8281 780 8161