没有根据列读取整个数据的子设置

时间:2018-01-13 16:30:34

标签: r

我有一个大数据,其中一列是Date in" character"类。在不同的读取函数中是否有任何参数用于读取仅在2017年1月13日 - 例如1/13/2018的行?或者至少在没有读取任何类中的总数据的情况下进行子集化的命令是什么?

感谢您的回复

1 个答案:

答案 0 :(得分:1)

假设我们在最后的Note中生成了测试文件。我们假设实际文件要大得多,否则我们可以直接使用 override val root = gridpane { orderTextArea = textarea { isEditable = false prefWidth = 900.0 prefHeight = 700.0 isWrapText = true //textProperty().bind(viewModel.orderText) style { textFill = Color.YELLOW **//backgroundcolor** } } 来读取它。相反,我们使用read.csv仅在2017年和2018年读入R.然后我们使用这个小得多的数据框架将其缩小到我们想要的日期:

read.csv.sql

为了表明它有效,我们会显示前几行和最后几行:

library(sqldf)

sql <- "select * from file where dates like '%2017' or dates like '%2018'"
dd <- read.csv.sql("testfile.csv", sql)
dd$dates <- as.Date(dd$dates, "%d/%m/%Y")
dd_sub <- subset(dd, dates > '2017-01-13' & dates <= '2018-01-13')

您拥有的实际文件格式可能与> head(dd_sub) dates value 14 2017-01-14 744 15 2017-01-15 745 16 2017-01-16 746 17 2017-01-17 747 18 2017-01-18 748 19 2017-01-19 749 > tail(dd_sub) dates value 365 2017-12-31 1095 366 2018-01-01 1096 367 2018-01-02 1097 368 2018-01-03 1098 369 2018-01-04 1099 370 2018-01-05 1100 不同,因此您需要仔细阅读testfile.csv并设置所需的任何参数。

注意

?read.csv.sql