标签: generalization
我的数据集中有一个变量,该变量具有300多个级别(邮政编码)。 我是否仍可以预测300或更高级别的模型,以使用城市或自治市镇等级别较低的模型? 如果我使用决策树或随机森林,是否会对我的预测模型造成任何问题? 我有3000多个观察结果