我有关于飞机事故的数据(事故发生日期和其他信息)。对于我的统计项目,我想分析数据。例如,我想描绘一下1995年到2000年之间三个月内的事故数量。意思是,在那个时期连续三个月,我想得到那段时间内的事故数量。如何在R中最有效地获得三个月的事故数量,以便我可以进一步操纵数据?
另外,我想统计测试我的数据是否遵循泊松分布。我可以在数据中使用R中的拟合优度检验吗?
到目前为止,我已经写过了。
我的想法是创建一个向量,其值代表1995年到2000年之间三个月内的崩溃次数。数据按日期排序,表中的每一行代表一次飞机失事。
$('#child_id').on('click', function (e) {
e.preventDefault();
e.stopPropagation();
});
它给了我一个错误:
Crash<-read.csv(file="nesrece95-99.csv", header=TRUE, sep=",")
Datumi=as.Date(Crash$Date,"%m/%d/%Y")
help(vector)
broj<-vector(mode="integer", length = 20)
ind<-integer()
ind=-1
god<-integer()
god=0
mjesec<-integer()
mjesec=0
help(date)
for(i in 1:length(Datumi))
{
if(year(Datumi[i])!=god)
{
ind=ind+1
god=year(Datumi[i])
print(god)
mjesec=1
}
else if(month(Datumi[i]> (mjesec+2)) )
{
ind=ind+1
mjesec=month(Datumi[i])
}
broj[ind]=broj[ind]+1
}
但我不知道究竟是什么问题。我稍后会更彻底地研究这些库。我是R的新手,但我必须将它用于我的项目。
答案 0 :(得分:0)
由于我对您的数据没有任何印象,我只能猜测,但是可能在3个月内对数据进行分组确实有意义吗? dplyr
- 包(look at the cheat sheet here)提供了一个分组功能,可以让您指定相应的三个月并总结事故数量。