我有一个大数据,其中一列是Date in" character"类。在不同的读取函数中是否有任何参数用于读取仅在2017年1月13日 - 例如1/13/2018的行?或者至少在没有读取任何类中的总数据的情况下进行子集化的命令是什么?
感谢您的回复
答案 0 :(得分:1)
假设我们在最后的Note中生成了测试文件。我们假设实际文件要大得多,否则我们可以直接使用 override val root = gridpane {
orderTextArea = textarea {
isEditable = false
prefWidth = 900.0
prefHeight = 700.0
isWrapText = true
//textProperty().bind(viewModel.orderText)
style {
textFill = Color.YELLOW
**//backgroundcolor**
}
}
来读取它。相反,我们使用read.csv
仅在2017年和2018年读入R.然后我们使用这个小得多的数据框架将其缩小到我们想要的日期:
read.csv.sql
为了表明它有效,我们会显示前几行和最后几行:
library(sqldf)
sql <- "select * from file where dates like '%2017' or dates like '%2018'"
dd <- read.csv.sql("testfile.csv", sql)
dd$dates <- as.Date(dd$dates, "%d/%m/%Y")
dd_sub <- subset(dd, dates > '2017-01-13' & dates <= '2018-01-13')
您拥有的实际文件格式可能与> head(dd_sub)
dates value
14 2017-01-14 744
15 2017-01-15 745
16 2017-01-16 746
17 2017-01-17 747
18 2017-01-18 748
19 2017-01-19 749
> tail(dd_sub)
dates value
365 2017-12-31 1095
366 2018-01-01 1096
367 2018-01-02 1097
368 2018-01-03 1098
369 2018-01-04 1099
370 2018-01-05 1100
不同,因此您需要仔细阅读testfile.csv
并设置所需的任何参数。
?read.csv.sql