Spark ML将计数地图转换为要素

时间:2018-05-27 13:05:11

标签: feature-extraction apache-spark-ml

我在特定的地方有一个scala Map of seenCounts,例如:

Map(beach -> 31, cafe -> 140, prison -> 2)

我应该如何将此类数据转换为机器学习功能?

目前我构建了一个List [String]项目,并使用CountVectorizer将其转换为feature,但是我忽略了特定位置频繁的信息。我不想丢失这些信息。

0 个答案:

没有答案