标签: matlab tags cluster-analysis large-scale
我试图在matlab中的用户标签的庞大稀疏矩阵中聚集一组标签,比如说:
35000 * 74000,稀疏度为99%。
我可能有两个选择:
1:制作标签的共生矩阵,并在Tag-Tag共现矩阵上应用聚类。
2:将用户视为标签的功能,并使用Transpose(用户标签)进行标签群集。
我不知道哪一个更好,但是它们都有大量用户和标签的问题。
非常感谢任何评论或建议的解决方案。