我是新来的,我很抱歉这个“问题”对你们有些人来说太愚蠢了。 我必须在大学进行k-mean聚类的C ++项目,我需要一些帮助。 这是代码。这是工作。 现在,我必须单独构建G-Matrix。在代码中我得到以下内容:
4.30 0.50 * 1 *
3.54 0.50 * 1 *
0.71 3.20 * 0 *
0.71 4.61 * 0 *
质心的坐标为:
4.50
3.50
质心的坐标为:
1.50
1.00
这很好,但我需要另外一个G-Matrix中的1,1,0,0
,如下所示:
A B C D
1 1 0 0 ->c1
0 0 1 1 ->c2
其中A,B,C,D
是点,c1
和c2
是质心。
知道怎么显示这个吗?
这是我的代码:
float dmin, dpoint;
float sum[2][2];
int cluster[4], count[4], group;
float flips;
const int rows = 4;
const int columns = 2;
const int crows = 2;
const int ccolumns = 2;
// initialize the points
int point[rows][columns]={{1,1},{2,1},{4,3},{5,4}};
// initialize the centroids
double centroid [crows][ccolumns] = {{1,1},{2,1}};
// ...
for (i = 0; i<4; i++) cluster[i] = 0;
// until there is no change of clusters belonging to each pattern, continue
flips = 4;
while (flips>0) {
flips = 0;
for (j = 0; j < 2; j++)
{
count[j] = 0;
for (i = 0; i < 2; i++)
sum[j][i] = 0;
}
// now, we need to calculate the distance
for (i = 0; i < 4; i++) {
dmin = 2; group = cluster[i];
for (j = 0; j < 2; j++)
{
dpoint = 0.0;
dpoint += sqrt(pow((point[i][0] - centroid[j][0]),2)+pow((point[i][1] - centroid[j][1]),2));
fprintf(stdout, "%5.2f ", dpoint); // Show the value of the distance
if (dpoint < dmin) {
group = j;
dmin = dpoint;
}
}
// now, we need to calculate the G matrix (1 or 0)
fprintf(stdout, " * %d *\n", group); // displays 0 or 1 (to which cluster it belongs)
if (cluster[i] != group)
{
flips++;
cluster[i] = group; // repeat this process until G(n)=G(n+1)
}
count[cluster[i]]++;
for (j = 0; j < 2; j++)
sum[cluster[i]][j] += point[i][j];
}
// now, display the coordinates of the centroid
for (i = 0; i < 2; i++) {
fprintf(stderr," The coordinates of the centroid are: \n");
for (j = 0; j < 2; j++) {
centroid[i][j] = sum[i][j]/count[i];
fprintf(stderr, "%5.2f \n", centroid[i][j]);
}
}
}
}
感谢您的帮助!
答案 0 :(得分:0)
好吧,将你的第三栏翻译成G-Matrix。
实际上是微不足道的。该列为您提供了设置为1的行号。