我想使用libsvm进行分类。我有9个训练集,每组有144000个标记实例,每个实例具有可变数量的特征。训练一组需要大约12个小时(./svm-train与概率估计)。由于我没有太多时间,我想一次运行多套。我不确定我是否可以这样做..我可以在不同的终端同时运行所有9个进程吗?
./svm-train -b 1 feat1.txt
./svm-train -b 1 feat2.txt
.
.
.
./svm-train -b 1 feat9.txt
(我正在使用fedora core 5)
答案 0 :(得分:7)
您可以告诉libsvm使用openmp进行并行化。看看这个libsvm faq条目:http://www.csie.ntu.edu.tw/~cjlin/libsvm/faq.html#f432
答案 1 :(得分:3)
正如Adam所说,这取决于您的系统可用的核心和处理器数量。如果这还不够,为什么不启动几个EC2实例来运行呢?
Infochimps MachetEC2公共AMI附带了您需要的大部分工具:http://blog.infochimps.org/2009/02/06/start-hacking-machetec2-released/
答案 2 :(得分:2)
是。但除非您拥有多核或多处理器系统,否则可能无法为您节省那么多时间。