目前,我正在寻找一种将R中的多个数据列表分为两个类的方法。理想情况下,我很想使用caret
包来实现此目的。
数据是通过一个周期性运行的周期性过程生成的,每48个周期进行一次测量。因此,这是一个时间序列(因为一个测量在另一个测量之后进行),但是我只将周期数作为时间维,这使得很难从对象中投射ts
或xts
对象数据。
这里是有关火车数据外观的想法。测试数据缺少Label
列:
library(tibble)
make.data <- function(){
data.inner <- tibble(
cycle = seq(from = 48, to = 240, by = 48),
value = runif(5),
predictor1 = LETTERS[sample(1:length(LETTERS),5)],
predictor2 = letters[sample(1:length(letters),5)]
)
data.inner$predictor1 <- factor(data.inner$predictor1)
data.inner$predictor2 <- factor(data.inner$predictor2)
return(data.inner)
}
data <- tibble(ID = 1:3,
Data = list(make.data(), make.data(), make.data()),
Label = c(1,1,-1))
我正在寻找一种方法,可以将Data
列强制转换为时间序列,该周期基于周期作为时间维度,而其他列作为值。然后对结果运行SVM(或类似的ML方法)。或直接通过和SVM使用数据来预测新(未知)数据的Label
列。