假设我正在开发类似Uber的应用程序,我想根据用户的过去历史记录,当前的经纬度以及当前的日期和时间来预测用户最可能的目的地。
我们有数百万个用户,但是每个用户的需求对于泛化而言可能太独特了。也就是说,每个人的通勤情况都非常不同,以至于您从其他用户那里学到的信息可能不适用于其他用户。
最后,我必须构建数百万个模型,如何将这些模型合并在一起以实现更好的部署过程?如果没有,部署数百万个模型的最佳实践是什么?
答案 0 :(得分:2)
我们有数百万个用户,但是每个用户的需求对于泛化而言可能太独特了。
您不需要构建数百万个模型。创建一个模型并针对每个/每个用户细分对它进行个性化设置。举例来说,Google根据用户行为对其应用程序(例如搜索引擎,Youtube和Play商店)进行了个性化设置。个性化不仅可以针对单个用户,而且可以针对一组用户。例如,“健身”应用程序中的“男性”和“女性”需要获得不同的建议。在这种情况下,假定您有两种用户。
行为是什么意思?您的搜索记录,您在Gmail帐户中的信息,会话以及通常被视为用户行为的许多其他内容。
向用户建议个性化信息是一个众所周知的研究问题,主要被认为是Recommender System。
我必须构建数百万个模型,如何合并这些模型 一起改善部署过程
合并模型是另一个研究领域,称为Ensembling learing。我们通常集成2到10个模型,但不集成数百万个模型。