我有一个XTS
数据集,其中包含许多名为dataset
的股票收盘价。然后我想通过cor()
查找他们的返回是否有任何关联,但是我收到一条错误消息:Error in cor(RETS) : 'x' must be numeric
。
这就是我所做的:
RETS <- CalculateReturns(dataset, method= c("log")) # Calculate returns Via PerformanceAnalytics
RETS<- na.locf(RETS) #Solves missing NAs by carrying forward last observation
RETS[is.na(RETS)] <- "0" #I then fill the rest of the NAs by adding "0"
以下是RETS
row.names A.Close AA.Close AADR.Close AAIT.Close AAL.Close
1 2013-01-01 0 0 0 0 0
2 2013-01-02 0.0035 0.0088 0.0044 -0.00842 0
3 2013-01-03 0.0195 0.0207 -0.002848 -0.00494 0
4 2013-01-06 -0.0072 -0.0174 0.0078 -0.00070 0
5 2013-01-07 -0.0080 0 -0.01106 -0.03353 0
6 2013-01-08 0.0266 -0.002200 0.006655 0.0160 0
7 2013-01-09 0.0073 -0.01218 0.007551 0.013620 0
然后我执行相关:
#Perform Correlation
cor(RETS) -> correl
Error in cor(RETS1) : 'x' must be numeric
#Tried using as.numeric
cor(as.numeric(RETS), as.numeric(RETS) -> correl
但答案是&#34; 1&#34;。我也尝试在psych
中使用相关函数,但得到相同的错误消息。
答案 0 :(得分:5)
我正在添加@Roland的回答来解决这个问题。
问题在于使用
RETS[is.na(RETS)] <- "0"
将所有数据转换为字符,因为将任何字符值添加到数值会自动将data.types更改为字符。因此,当您去获取相关性时,无法对字符值执行此操作。所以,如果你只是做
RETS[is.na(RETS)] <- 0
相反,您应该避免转换问题。
您可能还会考虑明确告诉NA
如何处理缺失值,而不是将您的缺失值设置为cor
。例如
cor(RETS, use="pairwise.complete.obs")
仅计算两个变量之间的相关性,两个变量都不是-NA。有关所有选项,请参阅?cor
帮助页面。