如何处理R中的非数字类别?

时间:2018-03-09 22:24:27

标签: r

我是R的新手并且遇到以下问题:我正在研究一个数据集,它不仅具有数值,还具有非数值(性别,状态)。我想开始查看数据并首先找到一些相关性。嗯,这仅适用于数值,数据集没有找到数值的任何相关性。我用ggcorr尝试了它,它省略了非数字列。

我的问题是:你如何对待这样的数据集?如果您有许多非数值类别,您如何找到相关性?另外,为这样的数据集创建线性模型的工作流程是什么?该模型应该预测一个人每年的收入是否超过5万。

感谢您的帮助!

编辑:This是我正在谈论的数据集。我正在考虑将类别转换为数值,然后通过cor.test()进行关联,但我不确定是否可以通过这种方式获得有效的相关数。基本上我的问题是:如何检查非数字和数值数据之间的相关性?

0 个答案:

没有答案