我应该如何构建我的张量流数据集以将其馈送到自定义RNN估计器中

时间:2018-11-30 16:05:41

标签: python tensorflow rnn sequential

我正在尝试使用custom estimator RNN来估计我网站上的客户是否会根据其点击行为来购买商品。因此数据集看起来像:

session_id  page_type   event            since_previous_click (s)   will_buy
1           search      SelectCountry    null                        0
1           search      SelectCountry    2                           0
1           search      SortResults      4                           0
1           product     SelectColor      20                          0
2           search      SelectCountry    null                        1
2           search      SortResults      10                          1
2           product     SelectSize       5                           1
2           product     SelectColor      23                          1
2           inmarket    EnterName        8                           1
2           inmarket    Booked           34                          1

因此,“ will_buy”是标签,page_type,event和since_previous_click是输入要素。但是,我的问题是我不知道如何构造input dataset。我知道维度应为[#数据点,#时间步长,#特征],其中应填充时间步长的数量,因为它们的长度不相同。但是我无法从张量(或numpy数组)构造此3D对象,因为存在多个dtypes(字符串和int32)。有帮助吗?

1 个答案:

答案 0 :(得分:0)

将页面类型和事件转换为一键引导。然后,您所有的数据都将为int32。