如何为回归模型分配权重(线性和非线性)

时间:2020-02-21 01:04:14

标签: r

数据集包含来自不同来源的许多价格点。对于相同的项目编号,价格广泛分布。因变量是价格,自变量是数量,还有其他一些变量。显然,某些价格点更接近均值且在1个标准偏差之内。我想对那些更接近均值或每组1个标准偏差(相同项目编号)的价格给予更多的权重。换句话说,我希望对item_no_1的$ 50和对Item_No_5的$ 3000给予最小的权重。无法删除$ 50和$ 3000,因为它们是有效价格而不是异常值。我该如何在R中使用回归模型(线性,KNN,随机森林等)?

Item_No_1 $5 
Item_No_1 $10 
Item_No_1 $5.5 
Item_No_1 $5.5 
Item_No_1 $5 
Item_No_1 $5 
Item_No_1 $4.8 
Item_No_1 $5.4 
Item_No_1 $50
Item_No_5 $300
Item_No_5 $400
Item_No_5 $600
Item_No_5 $3000
Item_No_5 $1200

0 个答案:

没有答案