控制R中glm()的分类截止

时间:2016-04-30 23:10:38

标签: r glm

与R -

相关的问题

我有一个CSV数据集获取为:

mydata <- read.csv("data.csv", header = TRUE) 

包含变量'y'(y是二进制0或1)以及另一个变量'weight'(权重是一个数字变量 - 取0到1之间的小数值)。

我将mydata分成火车(80%)和测试(20%)为:

d<-sort(sample(nrow(mydata), nrow(mydata)*0.8));
train <- mydata[d,];
test < -mydata[-d,];

然后,我在火车上执行加权glm(基本上是逻辑回归):

#Build GLM model on train data ***(A)
model <-glm(y~., data = train, weights = train$weight, family = binomial);

#Apply model on test ***(B)
score <-predict(model, type = 'response',test);

#Get classification for each observation in test as 'positive' or 'negative' ***(C)
classify <-performance(score,"tpr","fpr");

我的问题是:  在步骤(B)&amp; (C),如何控制分类规则,即R可以用模型拟合概率对观察进行分类&gt; 0.5为“正”,&lt; = 0.5为“负”。有没有办法可以改变这个阈值,比如0.75而不是R可能使用的任何东西(我用0.5作为例子)。

0 个答案:

没有答案