数据科学案例研究

时间:2019-02-18 15:41:07

标签: machine-learning classification data-science

请帮助我获得以下问题的正确答案,该问题是在一次采访中提出的。

有一家银行,没有用户访问银行以提供不同的服务,但是大多数用户的评分很差并且不满意。银行应该做什么来确定不良评级的原因。银行捕获数据,例如用户信息,与用户打交道的代理商信息,提供的服务,如果没有的话。

  1. 如何仅使用机器学习技术来识别在不良评分中起重要作用的规则或原因。

  2. 如果我们建立分类模型,则用户将不满意/满意。然后说我们得到了不满意的用户列表。现在,我们应该如何处理用户不满意的数据,以帮助银行提高评级和业务。

2 个答案:

答案 0 :(得分:1)

训练分类器以预测不满意情况。

不使用中性网络,而是使用可解释的东西。

然后解释功能重要性的模型。

一个不错的选择是随机森林。

答案 1 :(得分:0)

我希望您不满意的客户数据集能够提供有关不满意原因的信息,以及他们从银行获得的其他属性,例如用户详细信息,年龄,区域和服务。在这种情况下,可能会有更多的ML模型和算法需要进行培训和优化以获取准确的图片。但是,要查找的关键因素是与之关联的服务,不满意的原因,并且可能是它们映射到的主体。 上面提到的3个关键属性可以通过回归模型执行以获得预测和改进计划。请注意,机器学习模型的选择还取决于数据集的详细分析以及向利益相关者提出和提出正确的问题。