这是交易。 我正在尝试制作基于SVM的POS标记器。 SVM的特征向量是在格式转换器的帮助下创建的。 现在这是我正在使用的培训文件的屏幕截图。 http://tinypic.com/r/n4fn2r/8
我有各种POS标签的25个标签。当我使用java实现或命令行工具进行预测时,我得到以下结果。 http://tinypic.com/r/2dtw5ky/8
我已经尝试了所有可用的内核,但它给出了或多或少相同的结果。 即使将训练文件用作测试文件,也会发生这种情况。 请帮帮我.. !! 附:我不能分享超过两个链接。因此,这是模型文件的片段
svm_type c_svc
kernel_type rbf
gamma 0.000548546
nr_class 25
total_sv 431
rho -0.929467 1.01073 1.0531 1.03472 1.01585 0.953263 1.03027 -0.921365 0.984535 1.02796 1.01266 1.03374 0.949463 0.977925 0.986551 -0.920912 0.940926 -0.955562 0.975386 -0.981959 -0.884042 0.0516955 -0.980884 -0.966095 0.995091 1.023 1.01489 1.00308 0.948314 1.01137 -0.845876 0.968034 1.0076 1.00064 1.01335 0.942633 0.965703 0.979212 -0.861236 0.935055 -0.91739 0.970223 -0.97103 0.0743777 0.970321 -0.971215 -0.931582 0.972377 0.958193 0.931253 0.825797 0.954894 -0.972884 -0.941726 0.945077 0.922366 0.953999 -1.00503 0.840985 0.882229 -0.961742 0.791631 -0.984971 0.855911 -0.991528 -0.951211 -0.962096 -0.99213 -0.99708 -0.957557 -0.308987 -0.455442 -0.94881 -0.995319 -0.974945 -0.964637 -0.902152 -0.955258 -1.05287 -1.00614 -0.
更新 刚刚训练SVM的svm类型为c-SVC,内核类型为线性。这给出了非零(虽然很差)的准确性。
答案 0 :(得分:0)
正如@Pedrom所提到的,在训练SVM时,参数选择绝对至关重要。我建议你看一下this practical guide。此外,431个单词远远不足以训练25级模型。您肯定需要更多数据。
那就是说,0%的准确度确实很奇怪。您能否告诉我们您用于训练和评估模型的命令?