我想在Apache Spark中运行支持向量机(SVM)时有一些见解。
当我使用Spark主目录中给出的 run-example 脚本并使用参数org.apache.spark.mllib.classification.SVMWithSGD
时,它会显示以下
消息。我了解 Usage: SVM <master> <input_dir> <step_size> <regularization_parameter> <niters>
Usage: SVM <master> <input_dir> <step_size> <regularization_parameter> <niters>
, <master>
和 <input_dir>
参数。
你能帮我弄清楚其余的论点,或者至少把我引导到某种教学网站吗?
答案 0 :(得分:2)
答案 1 :(得分:2)
<step_size>
是学习率的起点。对于收敛,步长应该减小。在SGD中,这是通过获取step_size
的输入值并除以迭代的平方根来实现的。
<reg_param>
是调整约束强度的标量。小的价值意味着软边际,大的价值意味着艰难的利润。无限是最难的。