有关多元线性回归的变量的问题。百分比和比率+标准化

时间:2019-06-22 17:45:09

标签: r regression linear-regression

我是统计学和回归分析的新手。对于我们的R类,我们需要执行线性回归。

因变量:企业的市盈率

自变量:收入增长(%),ROA(%),住所地区,Beta(数量),市值(数量)。

我有几个问题:

  1. 变量可以是不同的数据类型还是应该是相同的类型?

  2. 我可以保留%变量还是应该转换它们?我不清楚。我看到有些人在excel中使用ln函数对它们进行了转换,但是我也有%的负数,这在excel中给出了错误。

  3. 由于数据范围很广,例如对于市值,我们需要进行标准化的锯。我们是仅对市值进行标准化还是需要对所有其他自变量进行标准化?我们也标准化因变量吗?

  4. 数据为横截面。我只有许多不同公司的2018年数据。进行多元线性回归还可以吗? 我必须包括有关住所区域的虚拟变量。我有美国和欧盟的公司。伪变量将如何查找?

感谢您抽出宝贵的时间。我真的很新,正在尝试学习这些东西。

0 个答案:

没有答案