假设你有这样的东西,其中表A和B只是一些值,而表C由两者之间的最大数字组成。
首先,我想知道如何选择C列中的所有元素,其中前一行(即前一天)的值不是来自同一列。因此,例如,16不会被选为本身,前一个值(22)来自B列,但是22将被选中。
其次,更一般地说,我正在尝试做的是条件概率,因此我想计算从列中选择的值的C概率,知道前一个值来自另一列。基本上,P(A | B发生在前一次观察中),P(B | A发生在前一次观察中),P(A | A发生在前一次观察中)和P(B | B发生在前一次观察中)
非常感谢你的帮助。
编辑:根据要求,这是一个可重复的最低范例(我认为)。感谢和赦免次优代码。
library(dplyr)
df <- data.frame(
A = freeny$y,
B = freeny$lag.quarterly.revenue
)
df$C <- case_when(
as.numeric(df$A) >= as.numeric(df$B) ~ as.numeric(df$A),
as.numeric(df$A) < as.numeric(df$B) ~ as.numeric(df$B)
)