标签: apache-spark apache-spark-mllib apache-spark-ml
我正在创建决策树模型,并且我正在使用数据集对其进行培训。
但是,此数据集中的某些列是 TimeStamps 或日期。我一直在阅读Apache的文档,但我们无法找到解析或将此值添加到features列的方法。
features
我知道如何做到这一点?
答案 0 :(得分:1)
基本上你需要将它们转换为特征。一种方法是使用年,月,周,甚至周末,小时等内容创建虚拟变量。这取决于您要为您的问题创建哪些功能。