Question

我是这个数据科学领域的新手。我有一个问题要对新数据应用随机森林。

我有这张桌子。

app.get("/testing", (req, res) => {
  testAsyncFunction().then((obj) => {
    res.send(obj );
  })
});

我假设，如果小组中的比例很高，那么参加小组的机会就很高。我使用随机森林建立了一个模型，并使用验证集（8/2分割）对其进行了测试。

我认为上述模型可以用于新数据。这是数据的一个例子。数据结构和变量含义相同，但变量数量不同。

Y prop_A prop_B
A   0.8    0.2
A   0.7    0.3
B   0.5    0.5
B   0.4    0.6
B   0.1    0.9

新数据未标记，因此我想使用与先前数据一起使用的随机森林进行标记。标记新数据是否正确？

在模型中，它不起作用（由于自变量不同）。

我该如何使用标记的数据基于模型标记新数据？