我想为表中的每个ID计算IRR(使用软件包tvm中的xirr函数),其中每个ID的行数不同。我相信我必须使用第一次出现到最后一次出现1,但是在那之后,我不确定该怎么做。有没有人有什么建议?
我在下面发布了一个示例数据框,为此,我尝试在dplyr中将summary函数与xirr函数一起使用,并编写一个for循环。没有成功。
exampledf<-data.frame(c(2, 2, 2, 3, 3, 3, 3, 3), c("2017-11-30", "2017-12-31", "2018-01-31", "2017-11-30", "2017-12-31", "2018-01-31", "2018-02-28", "2018-03-31"), c(-65000, 33000, 33000, -40000, 10250, 10250, 10000, 10500))
names(exampledf)<-c("ID","Date","CashFlow")
exampledf %>% group_by(ID) %>% summarise(
IRR = xirr(cf = exampledf$CashFlow, d = exampledf$Date, tau = NULL, comp_freq = 12, interval = c(-1, 10)))
预期结果应该类似于:
ID IRR
1 2 0.127
2 3 0.125
当前,当运行summary函数时,它将为两个ID返回相同的IRR,事实并非如此。我对for循环的尝试也未成功,这里的任何帮助将不胜感激!
答案 0 :(得分:1)
我们需要删除example$
中的summarise
,因为example$
将选择整个列,而不是每个'ID'中的'CashFlow'。此外,“日期”列类型应更改为Date
library(dplyr)
library(tvm)
exampledf %>%
mutate(Date = as.Date(Date)) %>%
group_by(ID) %>%
summarise(
IRR = xirr(cf =CashFlow, d = Date,
tau = NULL, comp_freq = 12, interval = c(-1, 10)))
# A tibble: 2 x 2
# ID IRR
# <dbl> <dbl>
#1 2 0.121
#2 3 0.119