基于评分算法匹配记录 - 监督学习

时间:2018-05-08 05:58:11

标签: machine-learning supervised-learning

我试图找出是否/如何监督学习技术可以应用于以下情况。

问题详情:

我们的系统中有一个客户客户(数十万)的数据库。我们的客户是小企业。过去多年来,我们的客户手动添加了所有客户数据。我们正在努力为我们的新客户在第一次设置我们的服务时自动化这一过程。我们有一个供应商准备提供一个庞大的数据库(让我们将其命名为CUSTOMER_DB) - 我们现有客户和潜在客户的所有客户的超级集合 - 但企业和客户之间没有可用的映射。我们希望通过预测客户列表,而不是在他们设置我们的服务时逐个手动添加客户列表,使我们的新客户/企业生活更轻松。

现在,对于给定的客户端(比如A),我们可以使用一组属性(少于10个)将CUSTOMER_DB中的记录映射到AEg,位置,成员资格等。我们希望表现最好基于评分算法的匹配,以便我们的客户可以从我们所展示的最佳匹配中进行选择。并通过搜索工具添加其余部分。由于有足够的培训数据(我们现有客户的业务到客户映射),我想有可能想出一个评分算法来找出最佳匹配。

假设评分算法是一种合理的解决方案,问题是识别客户的每个可匹配属性的分数。例如,位置匹配可以具有得分10(随机选择)并且成员匹配可以具有8的得分(再次随机选择)等等......现在,我需要为将要匹配的每个属性设置这些得分,并且还设置客户记录的最低总分,以决定是否将记录显示给客户。

问题

  1. 监督学习适合这个问题吗?还是矫枉过正?要么 不能申请?
  2. 如果是,是否有一个开源解决方案 问题类型?
  3. 如果不是,你能否指出我更好 替代?
  4. 如果没有开源解决方案(我怀疑),是 像我这样的新ML开发人员可以解决这个问题 几个星期?或者这太乐观了?
  5. 感谢您的时间。我不确定我是否能很好地解释这个问题。请问我是否需要详细说明或澄清问题。

0 个答案:

没有答案