用于分析R模型输出中的阈值的代码

时间:2013-08-26 13:21:19

标签: r machine-learning

我有一个文本分类问题,由两个类别组成 - 零个一个。到目前为止,我尝试通过创建文档术语矩阵来解决它,并通过SVM(使用RTextTools包)运行它。这是一段代码片段:(在R中)

models <- train_models(container, algorithms=c("SVM"))
results <- classify_models(container, models)
analytics <- create_analytics(container, results)
View(summary(analytics))

>>ALGORITHM PERFORMANCE

>>SVM_PRECISION    SVM_RECALL    SVM_FSCORE 
>>         0.64          0.63          0.63 

我的问题如下:

1.为什么结果矩阵中的所有预测值都在0.5-1之间?是不是应该是0-1?

2.假设我们将θ作为阈值来分离,高于它的所有分数都是1级,其余分数是0.我如何分析(在R中)这些精度和召回值的θ是什么?如何更改此阈值以获得不同的值?

3.如何在R中为每个类创建两个不同的阈值(标记为“未识别”之间的剩余值)?

0 个答案:

没有答案