我一直在使用R中的RandomForest软件包,这对于分类很有用,但在计算具有高度相关预测变量的数据集的变量重要性方面却很弱(比如我的) 我想切换到派对包(使用cforest)但是在使用cforest()时我找不到sampsize参数的等价物,这个参数对我来说特别重要,因为我有一个高度不平衡的数据集并且有使用抽样方法来解决这个问题。
或者,有没有办法将randomForest林传递给cforest(可以将s3对象转换为s4对象吗?!)我可以在randomForest中训练分类器并使用party包来获得变量的重要性.... / p>
非常感谢......