使用libsvm进行分类培训

时间:2010-03-10 08:29:09

标签: machine-learning libsvm

我想使用libsvm进行分类。我有9个训练集,每组有144000个标记实例,每个实例具有可变数量的特征。训练一组需要大约12个小时(./svm-train与概率估计)。由于我没有太多时间,我想一次运行多套。我不确定我是否可以这样做..我可以在不同的终端同时运行所有9个进程吗?

./svm-train -b 1 feat1.txt
./svm-train -b 1 feat2.txt
      .
      .
      .
./svm-train -b 1 feat9.txt

(我正在使用fedora core 5)

3 个答案:

答案 0 :(得分:7)

您可以告诉libsvm使用openmp进行并行化。看看这个libsvm faq条目:http://www.csie.ntu.edu.tw/~cjlin/libsvm/faq.html#f432

答案 1 :(得分:3)

正如Adam所说,这取决于您的系统可用的核心和处理器数量。如果这还不够,为什么不启动几个EC2实例来运行呢?

Infochimps MachetEC2公共AMI附带了您需要的大部分工具:http://blog.infochimps.org/2009/02/06/start-hacking-machetec2-released/

答案 2 :(得分:2)

是。但除非您拥有多核或多处理器系统,否则可能无法为您节省那么多时间。