我在Revolution R(Package RevoScaleR)中使用了rxLogit函数来对具有许多分类变量的数据(例如STATE-IL,FL,OH,CA,TX ..)和几个数字拟合逻辑回归模型变量。当我尝试使用rxPredict函数对数据进行评分时,我收到错误
INTERNAL ERROR: In rxPredict, the number of parameters does not match the number of variables: 16 vs. 45.
我理解的一件事是,因为评分数据只有较少的类别(比如STATE-IL的数据)。因此,提供给模型的参数数量少于模型中的变量。
我写的代码是:
winlossmodel <- rxLogit(Flag ~ price+quantity+product_group+state+mode_of_transportation+cluster, data = training_data)
winlosspredict <- rxPredict(winlossmodel, data=scoring_data,type="response",checkFactorLevels=FALSE)
这里的价格和数量是连续变量。 State,product_group,mode_of_transportation和cluster是分类变量。我的training_data包含所有州的数据,但scoring_data只有少数几个州的数据。这会导致错误吗?