我想在多个都是唯一的csv文件上训练机器学习模型。每个文件都是来自篮球比赛的时间序列数据的集合。我想训练一个模型来研究每个游戏并能够预测结果。我是否应该简单地告诉sci kit Learn或另一个软件包来遍历目标文件夹中的文件并对每个文件运行回归?先感谢您。
答案 0 :(得分:0)
如果所有文件都包含相同的功能,您可以将它们连接起来。如果某些特征的预处理方式不同(例如,它们在不同的文件中具有不同的范围),则应在串联之前使它们保持一致。然后使用获得的大数据框/数组进行模型训练。 另外,考虑对行进行洗牌。