我有一个大型的医疗保险索赔数据集,我想要应用GLM回归。我有4个分类预测变量,特别是性别,年龄组,国籍和房间类型(VIP,正常等)。
我的基本GLM模型将包括截距项和这4个变量。我现在想介绍双向交互,但我不确定哪些交互对模型有重要意义,哪些不对。为此,我希望运行所有可能的交互组合以及4个基本预测变量,然后根据某个特征(如AIC或BIC或R-square)比较所有模型结果。
我想知道在R中是否有一个函数或一个简单的方法来运行所有可能的交互并保存它们的AIC / BIC / R-square而不必为每个可能的模型写下glm函数。
要运行的模型的一些示例是:
1. intercept + Gender + Age + Nationality + RoomType
2. intercept + Gender + Age + Nationality + RoomType + gender*age
3. intercept + Gender + Age + Nationality + RoomType + gender*nationality
4. intercept + Gender + Age + Nationality + RoomType + gender*roomtype
5. intercept + Gender + Age + Nationality + RoomType + age*nationality
6. intercept + Gender + Age + Nationality + RoomType + age*roomtype
7. intercept + Gender + Age + Nationality + RoomType + nationality*roomtype
8. intercept + Gender + Age + Nationality + RoomType + gender*age + gender*nationality
等等。