相关误差:' x'必须是数字

时间:2014-06-06 07:31:05

标签: r numeric xts correlation stocks

我有一个XTS数据集,其中包含许多名为dataset的股票收盘价。然后我想通过cor()查找他们的返回是否有任何关联,但是我收到一条错误消息:Error in cor(RETS) : 'x' must be numeric

这就是我所做的:

RETS <- CalculateReturns(dataset, method= c("log")) # Calculate returns Via PerformanceAnalytics
RETS<- na.locf(RETS) #Solves missing NAs by carrying forward last observation
RETS[is.na(RETS)] <- "0"  #I then fill the rest of the NAs by adding "0"

以下是RETS

的示例
    row.names   A.Close    AA.Close AADR.Close  AAIT.Close   AAL.Close
1   2013-01-01    0            0            0         0         0
2   2013-01-02  0.0035      0.0088      0.0044      -0.00842    0
3   2013-01-03  0.0195      0.0207     -0.002848    -0.00494    0
4   2013-01-06 -0.0072     -0.0174      0.0078      -0.00070    0
5   2013-01-07 -0.0080      0          -0.01106     -0.03353    0
6   2013-01-08  0.0266     -0.002200    0.006655     0.0160     0
7   2013-01-09  0.0073     -0.01218     0.007551     0.013620   0

然后我执行相关:

#Perform Correlation
cor(RETS) -> correl
Error in cor(RETS1) : 'x' must be numeric

#Tried using as.numeric
cor(as.numeric(RETS), as.numeric(RETS) -> correl

但答案是&#34; 1&#34;。我也尝试在psych中使用相关函数,但得到相同的错误消息。

1 个答案:

答案 0 :(得分:5)

我正在添加@Roland的回答来解决这个问题。

问题在于使用

RETS[is.na(RETS)] <- "0"

将所有数据转换为字符,因为将任何字符值添加到数值会自动将data.types更改为字符。因此,当您去获取相关性时,无法对字符值执行此操作。所以,如果你只是做

RETS[is.na(RETS)] <- 0

相反,您应该避免转换问题。

您可能还会考虑明确告诉NA如何处理缺失值,而不是将您的缺失值设置为cor。例如

cor(RETS, use="pairwise.complete.obs")

仅计算两个变量之间的相关性,两个变量都不是-NA。有关所有选项,请参阅?cor帮助页面。