是机器学习的新手,但是,在尝试构建预测模型时,我所有的训练集变量都是分类的,
PREDICTOR_1 PREDICTOR_2 PREDICTOR_3
Found : 5 Best Match :2 Found, Supplier site: 5
No result : 2 Found :8 Found, Zone site : 1
Part NotFound:11 Not Found WDA:8 No Data Found :12
PREDICTOR_4 PREDICTOR_5 PREDICTOR_6
No result :11 Found with Different length: 1 High :10
Search begin: 7 No result :16 LOW : 4
Part Found With out Suffix : 1 No result: 4
PREDICTOR_7 PREDICTOR_8 PREDICTOR_9 RESULT
Direct_Match: 8 NO :8 Mpn Found within PCN: 3 Found :15
No result :10 YES :8 Mpn has no PCN :15 Not Found: 3
YES-REMOVE:2
我尝试使用R&#39的glm()函数,但我一直在
Warning message:
glm.fit: fitted probabilities numerically 0 or 1 occurred
1-我想知道是否可以仅使用分类数据来训练模型 2-这个错误是什么意思
答案 0 :(得分:1)
1这可以仅使用glm模型中的分类数据
2当一个(或多个)解释变量与响应变量的相关性等于1或-1时,会发生此错误。我建议您首先删除相关的exaplanatory变量(与其他解释变量)并删除此类解释变量具有响应变量的相关等于1或-1。这可以通过R中的cor
函数来完成。我建议分类数据的Kendal相关系数。试试cor( data, method = "kendall")