我是R的新手并且遇到以下问题:我正在研究一个数据集,它不仅具有数值,还具有非数值(性别,状态)。我想开始查看数据并首先找到一些相关性。嗯,这仅适用于数值,数据集没有找到数值的任何相关性。我用ggcorr尝试了它,它省略了非数字列。
我的问题是:你如何对待这样的数据集?如果您有许多非数值类别,您如何找到相关性?另外,为这样的数据集创建线性模型的工作流程是什么?该模型应该预测一个人每年的收入是否超过5万。
感谢您的帮助!
编辑:This是我正在谈论的数据集。我正在考虑将类别转换为数值,然后通过cor.test()进行关联,但我不确定是否可以通过这种方式获得有效的相关数。基本上我的问题是:如何检查非数字和数值数据之间的相关性?