我是这个数据科学领域的新手。我有一个问题要对新数据应用随机森林。
我有这张桌子。
app.get("/testing", (req, res) => {
testAsyncFunction().then((obj) => {
res.send(obj );
})
});
我假设,如果小组中的比例很高,那么参加小组的机会就很高。我使用随机森林建立了一个模型,并使用验证集(8/2分割)对其进行了测试。
我认为上述模型可以用于新数据。这是数据的一个例子。数据结构和变量含义相同,但变量数量不同。
Y prop_A prop_B
A 0.8 0.2
A 0.7 0.3
B 0.5 0.5
B 0.4 0.6
B 0.1 0.9
新数据未标记,因此我想使用与先前数据一起使用的随机森林进行标记。标记新数据是否正确?
在模型中,它不起作用(由于自变量不同)。
我该如何使用标记的数据基于模型标记新数据?