R - 根据前一天计算条件概率

时间:2017-11-16 09:39:32

标签: r dataframe probability

假设你有这样的东西,其中表A和B只是一些值,而表C由两者之间的最大数字组成。

enter image description here

首先,我想知道如何选择C列中的所有元素,其中前一行(即前一天)的值不是来自同一列。因此,例如,16不会被选为本身,前一个值(22)来自B列,但是22将被选中。

其次,更一般地说,我正在尝试做的是条件概率,因此我想计算从列中选择的值的C概率,知道前一个值来自另一列。基本上,P(A | B发生在前一次观察中),P(B | A发生在前一次观察中),P(A | A发生在前一次观察中)和P(B | B发生在前一次观察中)

非常感谢你的帮助。

编辑:根据要求,这是一个可重复的最低范例(我认为)。感谢和赦免次优代码。

library(dplyr)

df <- data.frame(
 A = freeny$y,
 B = freeny$lag.quarterly.revenue
)

df$C <- case_when(
 as.numeric(df$A) >= as.numeric(df$B) ~ as.numeric(df$A),
 as.numeric(df$A) < as.numeric(df$B) ~ as.numeric(df$B)
)

0 个答案:

没有答案