与R -
相关的问题我有一个CSV数据集获取为:
mydata <- read.csv("data.csv", header = TRUE)
包含变量'y'(y是二进制0或1)以及另一个变量'weight'(权重是一个数字变量 - 取0到1之间的小数值)。
我将mydata分成火车(80%)和测试(20%)为:
d<-sort(sample(nrow(mydata), nrow(mydata)*0.8));
train <- mydata[d,];
test < -mydata[-d,];
然后,我在火车上执行加权glm(基本上是逻辑回归):
#Build GLM model on train data ***(A)
model <-glm(y~., data = train, weights = train$weight, family = binomial);
#Apply model on test ***(B)
score <-predict(model, type = 'response',test);
#Get classification for each observation in test as 'positive' or 'negative' ***(C)
classify <-performance(score,"tpr","fpr");
我的问题是: 在步骤(B)&amp; (C),如何控制分类规则,即R可以用模型拟合概率对观察进行分类&gt; 0.5为“正”,&lt; = 0.5为“负”。有没有办法可以改变这个阈值,比如0.75而不是R可能使用的任何东西(我用0.5作为例子)。