使用R中的分类数据构建预测模型

时间:2015-04-15 12:25:47

标签: r classification glm logistic-regression

是机器学习的新手,但是,在尝试构建预测模型时,我所有的训练集变量都是分类的,

PREDICTOR_1     PREDICTOR_2              PREDICTOR_3
 Found        : 5    Best Match   :2        Found, Supplier site: 5   
 No result    : 2    Found        :8        Found, Zone site    : 1   
 Part NotFound:11    Not Found WDA:8        No Data Found       :12   
    PREDICTOR_4                       PREDICTOR_5   PREDICTOR_6
 No result   :11      Found with Different length: 1   High     :10    
 Search begin: 7      No result                  :16   LOW      : 4    
                      Part Found With out Suffix : 1   No result: 4    
     PREDICTOR_7   PREDICTOR_8                PREDICTOR_9       RESULT  
 Direct_Match: 8      NO        :8      Mpn Found within PCN: 3   Found    :15  
 No result   :10      YES       :8      Mpn has no PCN      :15   Not Found: 3  
                      YES-REMOVE:2 

我尝试使用R&#39的glm()函数,但我一直在

Warning message:
glm.fit: fitted probabilities numerically 0 or 1 occurred 

1-我想知道是否可以仅使用分类数据来训练模型 2-这个错误是什么意思

1 个答案:

答案 0 :(得分:1)

1这可以仅使用glm模型中的分类数据

2当一个(或多个)解释变量与响应变量的相关性等于1或-1时,会发生此错误。我建议您首先删除相关的exaplanatory变量(与其他解释变量)并删除此类解释变量具有响应变量的相关等于1或-1。这可以通过R中的cor函数来完成。我建议分类数据的Kendal相关系数。试试cor( data, method = "kendall")