我不确定这是否比熊猫问题更像统计数据。但这是我的问题:
我有一年内N个产品的零售交易数据集。三列数据:Col1 - Product_ID,Col2 - TransactionTime和Col3 - TransactionPrice。我的任务是分开两种类型的交易:
a)交易发生在促销期间,意味着价格“显着”低于正常价格一段时间(可能是一天,一个周末或几天)然后回到正常价格。
b)对于每个产品,想象/绘制回归,其中X = TransactionTime,Y = TransactionPrice。如何查明异常值,意味着“显着”远离回归线的交易?我的目标是查看回归残差值,但是如何在pandas中实现?