我有CSV文件,其中包含一些有关流量工程的变量(例如车道数,车道质量,人口等等)。
最后一列是ADT(平均每日流量),它是根据位于道路上的传感器计算出来的。
我想预测具有相同变量的其他道路的ADT,最后将我预测的ADT与我的CSV文件中的实际ADT进行比较。
我将数据集分为两部分(70%和30%)。
在Weka中,使用 K-Star 算法我选择了use training set
选项中的70%的数据集并测试其他30%选择supplied test set
。
我得到了一个好的结果,几乎有3%的误差来预测ADT。但问题在于它没有提供任何方程式来向我展示它如何计算ADT,从而无法将方程应用于其他数据集。
然而,当我使用线性回归算法(而不是K-Star)时,结果不好(误差的65%),但它提供了计算ADT的等式。
如何找到使用 K-Star 算法生成的公式?
答案 0 :(得分:0)
K-star算法是一个惰性分类器,它会找到与您尝试分类的实例“相似的成员”并使用其标签来提供分类(K-最近邻居的种类)。算法使用的唯一方程是两个实例之间的相似性函数(例如欧几里德距离)。
如果要使用分类器,可以将模型输出到文件,然后使用Weka(通过代码,GUI和命令行)对其他数据集进行分类。
祝你好运!