我正在尝试使用custom estimator RNN来估计我网站上的客户是否会根据其点击行为来购买商品。因此数据集看起来像:
session_id page_type event since_previous_click (s) will_buy
1 search SelectCountry null 0
1 search SelectCountry 2 0
1 search SortResults 4 0
1 product SelectColor 20 0
2 search SelectCountry null 1
2 search SortResults 10 1
2 product SelectSize 5 1
2 product SelectColor 23 1
2 inmarket EnterName 8 1
2 inmarket Booked 34 1
因此,“ will_buy”是标签,page_type,event和since_previous_click是输入要素。但是,我的问题是我不知道如何构造input dataset。我知道维度应为[#数据点,#时间步长,#特征],其中应填充时间步长的数量,因为它们的长度不相同。但是我无法从张量(或numpy数组)构造此3D对象,因为存在多个dtypes(字符串和int32)。有帮助吗?
答案 0 :(得分:0)
将页面类型和事件转换为一键引导。然后,您所有的数据都将为int32。