在Apache Spark中支持向量机

时间:2013-12-12 13:13:43

标签: machine-learning svm apache-spark

我想在Apache Spark中运行支持向量机(SVM)时有一些见解。
当我使用Spark主目录中给出的 run-example 脚本并使用参数org.apache.spark.mllib.classification.SVMWithSGD时,它会显示以下Usage: SVM <master> <input_dir> <step_size> <regularization_parameter> <niters>消息。我了解 Usage: SVM <master> <input_dir> <step_size> <regularization_parameter> <niters> <master> <input_dir> 参数。
你能帮我弄清楚其余的论点,或者至少把我引导到某种教学网站吗?

2 个答案:

答案 0 :(得分:2)

答案 1 :(得分:2)

<step_size>是学习率的起点。对于收敛,步长应该减小。在SGD中,这是通过获取step_size的输入值并除以迭代的平方根来实现的。

<reg_param>是调整约束强度的标量。小的价值意味着软边际,大的价值意味着艰难的利润。无限是最难的。