标签: apache-spark-sql
我有两个数据集
m1(1,,3,2) m2(3,1,,_).....
我想这样代表
项目 d1 _ 1 2 3 d2 _ 1 2 3 d3 _ 1 2 3 d4 _ 1 2 3
m1 1 0 1 1 1 _ 0 0 0 0 3 0 0 0 1 2 0 0 1 1
m2 3 0 0 0 1 1 0 1 1 1 < em> 0 0 0 0 0 0 0 0