我正在做一个程序,可以使用Kohonen Self-Organizing Maps对数字数据进行聚类,我试图让它尽可能通用。那么,如何根据数据集中项目数(输出节点数)的比例知道邻域的适当初始大小?
建议也将不胜感激。 :)
答案 0 :(得分:1)
您可以根据需要优化邻域功能。
如果在每个最佳匹配单位(BMU)周围定义一个圆,则可以选择此半径与低维空间中网格的大小成比例(可能为2d)。然后,您可以根据特定标准使半径保持不变或缩小,直到最后一次迭代。
另一个选择是使邻域固定,就像BMU中的一定数量的周围节点一样。
答案 1 :(得分:0)
如果你想让它“尽可能通用”,可能只有一种可能性:随机。但是我建议让它“尽可能不那么通用”然后你可以玩参数...