R中的线性模型,时间为变量

时间:2015-07-07 02:44:19

标签: r model large-data

感谢@Metrics对原始问题的回答。

我想从两个变量中建立一个线性模型。我的解释变量是时间变量。这是因为我将它转换为POSIXlt,但是当我这样做时,R返回了错误

 Error in (function (formula, data = NULL, subset = NULL, na.action =
 na.fail,  :    invalid type (list) for variable 'Time2'

如何将时间作为变量的线性模型?

旧问题: 30,000观察并拟合R中的模型

我有36,729个观测数据框。我想建立一个两个变量的模型,这样我就可以使用方程而不是所有那些数据点。现在让我们简单地寻找一个线性模型。

lm(v2~v1,df)

因为数据帧的大小,但似乎R(或我的计算机,也许?)无法处理命令。在运行命令一小时后,R仍然没有完成处理。

我该怎么办?我只需要等待更长时间吗?有没有办法让数据帧更轻松?是否有大量数据包? (我并不认为这个音阶符合“大量数据”的要求,但对于R和/或我的电脑来说,它似乎有很多。)

1 个答案:

答案 0 :(得分:1)

一个原因可能是(见str(data))您的解释变量是因子变量:请参阅因子解释变量和连续解释变量的时差。

library(microbenchmark)
microbenchmark(lm(Sepal.Length~Sepal.Width,data=iris),lm(Sepal.Length~Species,data=iris),times=1000)
Unit: microseconds
                                        expr      min       lq     mean   median       uq       max neval cld
 lm(Sepal.Length ~ Sepal.Width, data = iris)  896.324  948.129 1007.356  976.963 1011.174  2460.735  1000  a 
     lm(Sepal.Length ~ Species, data = iris) 1106.476 1173.432 1330.917 1211.064 1250.406 45466.654  1000   b