虚拟变量包括所有逻辑回归&在Stata中拆分数据?

时间:2017-04-03 08:49:07

标签: stata logistic-regression dummy-variable

我有3个问题如下:

Q1。我有大约10 - 15个分类变量,其中包含一些子级别。示例:国籍,性别等。在Stata中创建新的虚拟变量后,我有大约201个新的虚拟变量,没有包含其他独立的连续变量。我做了一些研究,发现许多人建议 (K-1)在使用多元回归技术时有1个虚拟变量作为参考,而有其他提到的方不需要它。 相当混乱的消息,因为我可以找到使用逻辑方法的有限信息。 (K-1)是否适用于逻辑方法,或者如果我包含所有虚拟变量,它不会有太大影响?

Q2。例如,如果(K-1)适用,我有9个国籍的虚拟变量,XYZ国家是最多的国籍,这应该作为参考并被排除在逻辑方程中?或者我应该通过包含“i”命令将其留给STATA来决定?

Q3。是否可以将数据集拆分为Stata中的训练和验证。 除了可以在R和其他软件中使用外,我在网上找不到任何信息吗?

0 个答案:

没有答案