我正在使用glm(y ~ x1 + x2 + x3 + x4, data = train.set, family = binomial(link = 'logit'))
在R中建立逻辑回归模型。在4个预测变量x1, x2, x3, x4
中,它们都是分类的。但是x1, x2, x3
的范围是0到10,x4
是二进制(0或1)。
我的问题是我应该如何正确预处理x4
?我之所以问是因为,我知道就预测而言,这是一个非常重要的变量,但是由于summary()
与其他预测变量的规模不同,因此它在post = Index('posts')
post.settings(
number_of_shards=1,
number_of_replicas=0
)
@post.doc_type
class PostDocument(DocType):
community = fields.ObjectField(properties={
'id': fields.IntegerField(),
'description': fields.TextField(),
'name': fields.StringField(),
})
中的重要性较低。
经历过类似情况的人可以分享您的方法吗?非常感谢!