标签: python linear-regression
我的数据集中有几个月(1月,2月,3月等)数据,并且正在使用pandas库生成虚拟变量。 pd.get_dummies(df ['month'],drop_first = True)
我想了解在这种情况下是否应该使用drop_first = True? 为什么使用drop_first和哪种类型的变量很重要?
答案 0 :(得分:0)
因此,如果我们具有n级分类变量,则需要使用n-1列来表示虚拟变量。