我正在学习Azure机器学习工作室,并在玩一个似乎无法理解的任务。 我正在使用分类,特别是两类决策森林和两类Logistic回归。
数据
我有一个包含用户信息的数据集。它们分为6个文件。一个文件包含一个特定月份中用户数据的快照。
因此,我有分别包含相同用户的1月,2月,3月,4月,5月和6月,它们位于单独的文件中。
客户数据包含有关个人(收入,年龄,位置等)以及客户拥有哪些产品(如果有)的信息。
目的
我想知道某人购买某种产品的可能性,并最终列出最有可能购买该产品的候选人。
我的想法和尝试
我想我应该合并数据集,以使其可以进行测试。
我想到了很多事情,但是我已经完成了以下解决方案-现在我陷入了困境。
尝试:
我合并数据集,并在列中注明日期,以表示月份。现在,我有一个数据集,其中同一个人出现6次,但月份指示符不同。
简化示例
PersonId:1-收入:1000-年龄:25-产品=错误的月份-1 PersonId:2-收入:2000-年龄:35-产品=真实月份-1 PersonId:1-收入:1005-年龄:25-产品=错误的月份-2 PersonId:2-收入:1900-年龄:36-产品=错误的月份-2 PersonId:1-收入:1500-年龄:25-产品=真实月份-3 PersonId:2-收入:1800-年龄:36-产品=虚假月份-3
但是,我不知道如何指示Azure学习工作室“将同一个人链接在一起”,并使其“查看有关数据更改的时间进度”。 目前,它将上面的示例视为6个不同的人,而不是他们是同一个人,并且数据不断更改
结论 我真的无法弄清楚如何“指示Azure机器学习Studio”正在处理一段时间。
我已经搜索过了,但是我真的无法弄清楚要搜索什么。我认为这是大多数人都可以做的基本主题。 -也许我只需要格式化数据即可。但是我不知道如何。
感谢您的帮助。