我正在应对数据科学挑战。我需要一些有关如何继续开发我的解决方案的帮助。 我的数据集的快照如下所示:
此数据集是由一家制药公司收集的,该公司试图将其药品出售给不同专业的医生。
该制药公司已经为其品牌进行了促销活动
促销活动包括拨打电话,发送电子邮件和发送传真。数据集显示已发出多少个呼叫(“已发出的呼叫”列),成功完成了多少个呼叫(“已成功完成呼叫”列),已发送多少电子邮件(已发送“电子邮件已发送”列),已打开多少电子邮件(“已打开的电子邮件”列),发送了多少传真(“已发送的传真”列)。 品牌1是药品公司的品牌。品牌2是其竞争对手的品牌。
数据集显示各种品牌的销售量。 品牌1销售(公司品牌)-药品公司品牌的销售数量 品牌2销售(竞争对手品牌)-竞争对手品牌的销售数量 品牌市场销售总额-市场上所有品牌(销售品牌药物的所有公司)的销售数量 市场总额(品牌+无品牌)销售-所有品牌和无品牌药物的销售数量
我的任务是使用该数据集开发一个ML系统,该系统将建议在未来的促销活动中使用三个渠道(呼叫/电子邮件/传真)中的哪个。 如何开发这样的系统?我的理解是,这是具有三个类别(电话/电子邮件/传真)的分类问题。对于潜在客户,我必须将他/她分为三个类别之一,以表明要使用哪种渠道。
我应该做什么样的特征工程?我可以使用哪种型号?
答案 0 :(得分:0)
我已经针对此问题开发了一种解决方案。我将数据集分为三个集群(电话,电子邮件,传真),然后将分类为集群的每个客户分配给相应的营销渠道。我使用客户数据点到群集质心的距离计算了渠道亲和力得分。
该解决方案已上传至github仓库: https://github.com/skumaravel/Marketing-Channel-Recommendation-System
它包含一个jupyter笔记本,其中包含解决方案的python代码,数据集和解释我的方法的pdf报告。