标签: hadoop sequencefile
我想在一台机器上创建具有haddop API的文件地址列表文件地址列表。然后将此输出提供给sparse-vector,然后clustering。对于稀疏和聚类,我从here获取代码。 ReutersToSparseVectors和KMeansClustering。 在here中是写序列文件的代码。但是,当我将序列输出提供给稀疏时,程序会给出错误。
sparse-vector
clustering
ReutersToSparseVectors
KMeansClustering