如何在我的功能中包含日期/时间戳

时间:2017-08-04 18:28:35

标签: apache-spark apache-spark-mllib apache-spark-ml

我正在创建决策树模型,并且我正在使用数据集对其进行培训。

但是,此数据集中的某些列是 TimeStamps 日期。我一直在阅读Apache的文档,但我们无法找到解析或将此值添加到features列的方法。

我知道如何做到这一点?

1 个答案:

答案 0 :(得分:1)

基本上你需要将它们转换为特征。一种方法是使用年,月,周,甚至周末,小时等内容创建虚拟变量。这取决于您要为您的问题创建哪些功能。