我目前在具有全国代表性的数据集上使用随机森林,每次观察都包含概率权重,希望我可以在自举过程中使用这些权重。
我主要是使用randomForest软件包的R用户,经过一些调查后我发现虽然你可以对特定类进行加权,但似乎并没有对特定观察进行加权的方法(见第一个答案的评论here)。
另一方面,在python中实现scikit的随机森林有一个sample_weight参数,可以按照我需要的方式对观察进行加权。
我只是好奇地知道:是否有办法使用现有的R包对R中的随机森林进行加权观察,或者我是否应该转移到Python执行此任务? < / p>