python - 如何在具有分类变量和连续变量的数据集中查找和计算相关性？

对于这个问题，购买第二条保单更多是概率性事件，而不是确定性事件。例如，您的客户A购买另一种保险的可能性而客户A不会购买的可能性

首先，您需要一个假设。购买第二个保单是您的因变量（顾名思义，它将依赖其他变量的值）；这就是方程式的Y您认为哪些因素会导致客户获得另一项保单？

根据您在保险领域的经验，您可能会说X年龄以上的客户或Y年龄以上的客户来自Z性别等等。这些是您的独立变量-等式的X。

如果您真的想使用Python，请检查https://scikit-learn.org/stable/modules/linear_model.html#ordinary-least-squares，但如果是我，我将开始使用Excel，如果情况变得更加复杂，请切换到Python。

对于分类数据，您可以为其分配值...例如，性别1代表男性，0代表女性。检查此链接以获取更多信息https://scikit-learn.org/stable/modules/preprocessing.html#encoding-categorical-features