标签: apache-spark machine-learning
我正在使用Apache Spark的Mllib进行Twitter情绪分析。即使我在不同类型的数据上训练和测试它(即,从不同的Twitter搜索查询获得的推文),MLlib的决策树算法总是给出98到100%之间的准确度。在机器学习中,它通常被称为,如果它提供100%的准确度,模型就会过度拟合。在我的情况下它是一样的吗?我是机器学习的新手。请帮助我澄清我的疑问。提前致谢