在R中操纵日期

时间:2017-06-02 15:32:16

标签: r date statistics poisson

我有关于飞机事故的数据(事故发生日期和其他信息)。对于我的统计项目,我想分析数据。例如,我想描绘一下1995年到2000年之间三个月内的事故数量。意思是,在那个时期连续三个月,我想得到那段时间内的事故数量。如何在R中最有效地获得三个月的事故数量,以便我可以进一步操纵数据?

另外,我想统计测试我的数据是否遵循泊松分布。我可以在数据中使用R中的拟合优度检验吗?

到目前为止,我已经写过了。

我的想法是创建一个向量,其值代表1995年到2000年之间三个月内的崩溃次数。数据按日期排序,表中的每一行代表一次飞机失事。

$('#child_id').on('click', function (e) {
            e.preventDefault();
            e.stopPropagation();
});

它给了我一个错误:

Crash<-read.csv(file="nesrece95-99.csv", header=TRUE, sep=",")
Datumi=as.Date(Crash$Date,"%m/%d/%Y")
help(vector)
broj<-vector(mode="integer", length = 20)
ind<-integer()
ind=-1
god<-integer()
god=0
mjesec<-integer()
mjesec=0

help(date)
for(i in 1:length(Datumi))
  {
  if(year(Datumi[i])!=god)
    {
    ind=ind+1
    god=year(Datumi[i])
    print(god)
    mjesec=1
  }
  else if(month(Datumi[i]> (mjesec+2)) )
  {
    ind=ind+1
  mjesec=month(Datumi[i])
  }
  broj[ind]=broj[ind]+1
}

但我不知道究竟是什么问题。我稍后会更彻底地研究这些库。我是R的新手,但我必须将它用于我的项目。

1 个答案:

答案 0 :(得分:0)

由于我对您的数据没有任何印象,我只能猜测,但是可能在3个月内对数据进行分组确实有意义吗? dplyr - 包(look at the cheat sheet here)提供了一个分组功能,可以让您指定相应的三个月并总结事故数量。