Weka可以读取csv文件,但是,如果csv文件的格式不完全满足Arff文件标准,则可能会引起一些问题。例如,我发现向Weka加载时间序列CSV文件会导致重复出错。
有一些关于使用python将csv转换为arff在线的帖子,但我认为代码有点冗长而且并不总是有效。
是否有一种更安全,更快捷的方式将Csv转换为R中的arff?
答案 0 :(得分:2)
简单,使用包RWeka
library(RWeka)
write.arff(iris, file = "iris.arff")
答案 1 :(得分:1)
对于Mac用户(由于RWeka for mac尚未修复):
对于无法使用CSVLoader加载到Weka的CSV文件,使用R的外部库将数据集从csv文件转换为arff文件
以下R代码可以将timeSeries数据集从csv转换为Weka接受的arff文件
library(dplyr)
library(lubridate)
library(foreign)
byd = read.csv('byd_ready.csv')
byd %>% glimpse()
byd = byd %>% mutate(tradeDate = as.Date(tradeDate))
write.arff(byd, file='byd_R1.arff')