应用错误收集

在Apache Spark中支持向量机

时间：2013-12-12 13:13:43

标签： machine-learning svm apache-spark

我想在Apache Spark中运行支持向量机（SVM）时有一些见解。
当我使用Spark主目录中给出的 run-example 脚本并使用参数org.apache.spark.mllib.classification.SVMWithSGD时，它会显示以下Usage: SVM <master> <input_dir> <step_size> <regularization_parameter> <niters>消息。我了解 Usage: SVM <master> <input_dir> <step_size> <regularization_parameter> <niters> ， <master> 和 <input_dir> 参数。
你能帮我弄清楚其余的论点，或者至少把我引导到某种教学网站吗？

2 个答案:

答案 0 :(得分：2)

They are explained in the docs in the last section.

答案 1 :(得分：2)

<step_size>是学习率的起点。对于收敛，步长应该减小。在SGD中，这是通过获取step_size的输入值并除以迭代的平方根来实现的。

<reg_param>是调整约束强度的标量。小的价值意味着软边际，大的价值意味着艰难的利润。无限是最难的。