我有一个医院评级数据集,当我刚刚摔断腿时需要找到最好的医院。那么什么是我可以使用的最佳数据挖掘模型以及如何使用 找哪个模型更好?
https://www.kaggle.com/center-for-medicare-and-medicaid/hospital-ratings#=
答案 0 :(得分:1)
这完全取决于你的设计。您需要为每个变量附加一个权重,这是您重视该变量的方式。
医院位置是限制因素吗?也许你只能在断腿上蹒跚步行5英里,或者你可能是一名芭蕾舞者,可以将你的私人飞机预定到好莱坞。
如果您没有办法连接API以根据您的位置和医院地址确定距离,那么您只需要完全丢弃位置。
如果你只是摔断了腿,护理的及时性可能非常重要。但是如果你想得到一个布道工作,那么你可能不介意等待一两个月,只要它做得非常好。
在这种情况下,护理的有效性可能是最有价值的变量。我会从那开始,然后努力添加更多变量并改进你的答案。如果两家医院同样有效,会发生什么?然后患者满意度可能是下一个最重要的等等。