是否存在R函数来查找二进制结果与多个变量中的多个类别之间的关系

时间:2019-05-21 10:40:27

标签: r correlation

试图更好地解释我的问题的假想例子。假设我有成千上万的房屋,并且每个房屋都有二元结果,在这种情况下,是否至少以原始要价购买了房屋。然后我为每个房子有几个变量,例如位置,房屋颜色,平方英尺,屋顶类型。在大多数情况下,非数字类别。每个样本表如下:

Sample table

是否有一个函数或我可以从中读到的东西,这可以帮助我弄清楚该数据中是否有任何模式可以确定哪些变量组合产生是(或否)结果?

例如,即使在15000行数据中,我也可以在Excel中快速查看给定县或所有县的“ Y”个数。但是我无法浏览所有可能的组合,例如A郡,屋顶类型为A的白色房屋与B郡,屋顶类型为C的红色房屋,等等。

我希望达到的最终结果是能够得出一些结论,例如“这里是最常导致是的变量组合,而在这里最常导致否的变量组合”。 “这里是无关紧要的变量”。

0 个答案:

没有答案