请注意,这不是对https://stats.stackexchange.com/questions/223256/tensorflow-cross-entropy-for-regression的重复查询
由于目的不同,所以这个问题正在提出解决方案。在这里,我自己提出了一个我不知道如何开始的解决方案。
我正在在线超级市场工作,我目前的工作是预测新鲜商品的日销售量。
我尝试使用时间序列模型ARMA和xgboost,但都不合适。 问题在于,通常每天结束前每种产品都可能售罄/缺货。
因此问题开始变成恢复最初的实际每日销售计数。
您知道,新鲜的东西很容易腐烂,这就是为什么我们不能库存太多,导致缺乏正常数据的原因。
例如,我计算最近147天的虾缺货点(按小时):
最近147天的平均销售量(按小时):
但是我不能仅仅使用#define IMAX_BITS(m) ((m) /((m)%0x3fffffffL+1) /0x3fffffffL %0x3fffffffL *30 \
+ (m)%0x3fffffffL /((m)%31+1)/31%31*5 + 4-12/((m)%31+3))
int main(void)
{
int x = 2;
for (unsigned mask = 1U << (IMAX_BITS((unsigned)-1) - 1); mask; mask >>= 1)
{
putchar((unsigned) x & mask ? '1' : '0');
}
puts("");
}
来恢复每日销售数量。
因为average sale count
可能只有10分,而11.pm
可能只有140分,所以非常不平衡。
其他数据包括当天的天气,假日和总用户数等。
我提出一个解决方案:
通过计算:
C1:计算每小时的总天数,该产品本小时内没有缺货,并且该小时内有order(> = 1)。
C2:计算每小时的总天数,该产品不是缺货。
我使用C1 / C2绘制以下内容:
这是一天中的产品订购率。
然后,我认为,如果某天一天内21小时内产品缺货,但是我还有3小时订单数。 因此问题就变成了使用历史分布来根据3点恢复这一天的分布。 我如何恢复当天的总订单数? 我认为有可能,但是我不知道如何开始,使用什么算法。