我是分析师的新手,并研究了生产模型的各种方法。假设对于线性回归,我们可以得到y = mx + c的方程式,我们可以将它用于传入数据,我们可以将它从R / SAS / Python中取出并在任何数据库中使用它...
如果我想在R / SAS / Python框架之外的传入数据上生成它,它如何用于XG boost / Decison树/随机林?从哪里可以得到自变量的参数?
我从哪里开始实施等式?
由于
答案 0 :(得分:1)
决策树是三者中最容易的,就在那时声明。 GB本质上是自适应的。看似复杂,但得分代码并不复杂。 RF是最令人不安的,不是因为它的逻辑,而是因为不太复杂的RF模型可以拥有数百万行if-then。只是头顶上就是杀人。
与回归模型不同,三者都不应该有任何参数。它们都是TREE。如果需要在R,P或S之外运行它们,请考虑API的路径。我见过人们非常快速地解析XML中的RF。根据交付要求,您可能需要也可能不需要使用微服务。希望这可以帮助。