标签: feature-extraction apache-spark-ml
我在特定的地方有一个scala Map of seenCounts,例如:
Map(beach -> 31, cafe -> 140, prison -> 2)
我应该如何将此类数据转换为机器学习功能?
目前我构建了一个List [String]项目,并使用CountVectorizer将其转换为feature,但是我忽略了特定位置频繁的信息。我不想丢失这些信息。