我试图将RDD
SparseVector
转换为DataFrame
。我已经在Scala
和Python
中完成了此操作但从未在Java
中完成此操作,确实可以找到答案here。
我试图找到涵盖此主题的示例,但我找不到任何内容。尽管如此,它显然与Scala的工作方式相同,但我无法复制它。
答案 0 :(得分:0)
我终于可以实现它了。用于转换SparseVector
的正确架构必须设置为dataType
和new VectorUDT
,请注意,如果您按照示例操作,则通常使用 DataTypes 。< em>某事,所以非常艰难。
List<StructField> fields = new ArrayList<>();
StructField field = DataTypes.createStructField("features", new VectorUDT(), true);
fields.add(field);
StructType schema = DataTypes.createStructType(fields);