我是统计学和回归分析的新手。对于我们的R类,我们需要执行线性回归。
因变量:企业的市盈率
自变量:收入增长(%),ROA(%),住所地区,Beta(数量),市值(数量)。
我有几个问题:
变量可以是不同的数据类型还是应该是相同的类型?
我可以保留%变量还是应该转换它们?我不清楚。我看到有些人在excel中使用ln函数对它们进行了转换,但是我也有%的负数,这在excel中给出了错误。
由于数据范围很广,例如对于市值,我们需要进行标准化的锯。我们是仅对市值进行标准化还是需要对所有其他自变量进行标准化?我们也标准化因变量吗?
数据为横截面。我只有许多不同公司的2018年数据。进行多元线性回归还可以吗? 我必须包括有关住所区域的虚拟变量。我有美国和欧盟的公司。伪变量将如何查找?
感谢您抽出宝贵的时间。我真的很新,正在尝试学习这些东西。