我从csv导入,我需要一些帮助来获取我需要的数据。从本质上讲,它是一个包含投资回报的csv文件,每个投资都有两列(一个包含日期,另一个包含返回值)。列的格式如下:
Investment1 Investment2
6/1/2013 -0.043 1/1/2014 0.08
7/1/2013 0.003 2/1/2014 0.01
8/1/2013 0.14 3/1/2014 -0.09
9/1/2013 0.09 4/1/2014 0.015
10/1/2013 0.03 5/1/2014 0.03
11/1/2013 0.02 6/1/2014 0.05
12/1/2013 0.04 7/1/2014 -0.15
如您所见,投资回报从最旧到最新(并非所有投资回报都在同一天开始),但是,所有投资都包含至少过去12个月的数据。我想在这里完成两件事: 1.)使用前一列中的标题自动填充“Return”列标题,并为其添加“返回”。我想预期的结果如下所示:
Investment1 Investment1 Returns Investment2 Investment2 Returns
6/1/2013 -0.043 1/1/2014 0.08
7/1/2013 0.003 2/1/2014 0.01
8/1/2013 0.14 3/1/2014 -0.09
9/1/2013 0.09 4/1/2014 0.015
10/1/2013 0.03 5/1/2014 0.03
11/1/2013 0.02 6/1/2014 0.05
12/1/2013 0.04 7/1/2014 -0.15
2。)我需要获取每个安全性的前12个月的数据。所以结束文件看起来像上面的数据,但仅适用于2015年2月 - 2016年1月
我会发布一些代码,但我不知道除了在csv文件中读取之外还从哪里开始。非常感谢!
答案 0 :(得分:0)
要更改列名称,您可以执行以下操作:
dat <- read.csv(file = "file", header = T)
names <- colnames(dat)
names[2] <- names [1]
names[4] <- names[3]
colnames(dat) <- names
您也可以输入自己的列名称,例如:
colnames(dat)[2] <- "Investment 1 Return"