使用R读取一个数据帧中的不均匀.csv文件

时间:2017-06-09 19:08:41

标签: r csv

如果可能,我需要以下帮助,请告诉我您的意见

My ObjectTive: -

我有多个.csv文件一个位置。 所有.csv文件具有不同数量的行(m)和列(n),即m =!n 所有csv文件都有一个几乎相似的日期(日历日和时间戳,例如:04/01/2016 7:01)但有趣的是一些数据丢失了一些时间戳 所有.csv文件都有以下常见数据(打开,高,低,关闭,日期)。 我的目标是仅导入"关闭"所有.csv文件中的列,但每个文件具有不同的行数,因为某些文件中缺少某些时间戳数据。

  1. 如果在任何情况下任何时间戳数据丢失但前一个存在,则重复以前的值。
  2. 如果在任何情况下,任何时间戳数据丢失且之前的数据也丢失,则将“' NA'在上面。这仅适用于前几个数据点。
  3. 这是我的计划: -

    1. 读/写文件:我们需要实现一种逻辑以某种方式读取文件,然后分别为不同的仪器组写入单独的文件。
    2. 时间序列不一致:您会注意到某些证券的时间序列不一致且连续,因此您需要生成自己的日期时间戳,然后针对每个日期戳(无论何时可用)填充数据。

    3. 缺少数据点:您将有一些时间戳没有数据,通过使用来自时间戳的数据填充缺失的点来使您的时间序列连续。

1 个答案:

答案 0 :(得分:0)

也许试试

read_in <- function(csv){
             f <- read.csv(csv)
             f <- f[!is.na(f$time_stamp),]
             f$close
}

l <- lapply(csv_list, read_in)
df <- rbindlist(l)