我想在大型数据集中找到不同状态下工资对比的线性回归。我只找到了只有两列的小型数据集的方法,而且我不知道如何将它们应用到我的20级别的大规模数据中。
我有从R到R的导入表数据1,看起来像这样(我想忽略工资和州以外的列):
person_no wages state sex age education kids
1 123 1000 1 f 24 12 1
2 124 1250 5 m 45 8 0
3 125 15000 12 f 56 16 3
4 126 8500 24 m 34 16 2
...
我已经尝试为levels(data1$state)
的状态创建关卡,但我已经得到了。{I}
错误消息object of type 'closure' is not subsettable
因此我用
创建了虚拟变量S1 <- ifelse(data1$state==1,1,0) and I don't know how to proceed.
我也试过contrast()
:
contrasts(data1$wage) = contr.treatment(16)
但我只会遇到错误。请帮我!