我有以下问题:
数据采用长格式,我使用dcast进行宽幅格式化。 我的ID变量中的一些但不是全部都是数字的,之后它们前面有一个X,我不能轻易摆脱它,因为一些字符ID可用性也以X开头,变量名长度也可能不同。例如,123变为X123。
以下是一个示例代码:
x=data.frame(c("2000-01-01","2000-06-01","2001-01-01"),c("XYZ","123","456"),c(200,200,200))
colnames(x)=c("Date","Ticker","Price")
x2=data.frame(dcast(x, "Date ~ Ticker", value.var="Price",fun.aggregate=mean))
这就是我得到的:
> x2
Date X123 X456 XYZ
1 2000-01-01 NaN NaN 200
2 2000-06-01 200 NaN NaN
3 2001-01-01 NaN 200 NaN
这就是我想要的:
> x2
Date 123 456 XYZ
1 2000-01-01 NaN NaN 200
2 2000-06-01 200 NaN NaN
3 2001-01-01 NaN 200 NaN
注意:我想使用base R来解决这个问题(与reshape2一起)。
以下链接对我没有帮助,我在reshape2 pdf上找不到任何信息。