如何在C或C ++中实现二分匹配算法(可能基于最大流算法)?
具体来说,我在文件中输入了这个: (1,3) (1,5) (2,5)
(M,F) - >其中M代表MALE的id,F代表FEMALE的id。
我需要找到最大匹配数并显示匹配的情侣。 喜欢: 匹配:1& 3,2& 5
我已经读过一些书籍,我可以将这个问题基于“网络中的最大流量”算法,但除了句子“这个问题可以通过......算法解决”之外,我找不到任何具体的信息。 ”。 我对max-flow知之甚少,也不知道如何实现它......
答案 0 :(得分:6)
是的,二分匹配可以减少到最大流量:
您获得了一组节点M
和F
。如果您的文件中有m
对,请将M
中的节点f
添加到F
中的节点(m, f)
。
将S
的定向边缘S
添加到M
中的每个节点(这是您的“超级源”节点)。
从T
中的每个节点添加一个带有定向边缘的单个节点F
到T
(这是您的“超级接收”节点)。
现在,您需要找到从S
到T
的最大流量(权重1的所有边缘)。
那么最大的流量是什么?从S
到T
的流是一组边,这样每个节点(S
和T
除外)的权重 in-flux 边缘与其 out-flux 边缘的权重相同。想象一下,您的图表是一系列管道,您正在S
向系统注水,并在T
处将其放出。在它们之间的每个节点,进入的水量必须与出水量相同。
尝试说服自己一个流程对应于原始集合的匹配。 (给定流程,如何获得匹配?给定匹配,如何获得流量?)
最后,要查找图表中的最大流量,您可以使用Ford-Fulkerson algorithm。上面的维基百科页面用伪代码对它进行了很好的描述。
答案 1 :(得分:3)
是的,如果您已经有代码来解决最大流量问题,您可以使用它来解决二分匹配问题,方法是在this讲座结束时转换图形,但这可能不是正确的方法如果你是从头开始。如果您只想实现一些相当简单的代码来解决问题,而不是太大,那么最好使用简单的扩充路径方法,如here所述。这为您提供了一种O(| V || E |)方法,该方法非常容易编码,并且适用于所有非常大的图形。如果你想要具有更好的最坏情况性能的东西,你可以尝试Hopcraft-Karp算法,它一次找到多个扩充路径并且具有O(sqrt(| V |)| E |)运行时限,但是维基百科上的文章指出:
有几位作者表演过 二分法的实验比较 匹配算法。他们的成绩 一般倾向于表明 Hopcroft-Karp方法不是很好 在理论上实践:它是 表现优于两者 广度优先和深度优先 寻找增强的策略 路径,并通过push-relabel 技术。
在任何情况下,在尝试解决Hopcraft-Karp或维基百科文章参考文献中提到的推送可重新技术之一之前,您应该明白并且能够实现简单的扩充路径方法。
编辑:由于某种原因,上面的链接没有正确显示。以下是相关网址:(http://oucsace.cs.ohiou.edu/~razvan/courses/cs404/lecture21.pdf),(http://www.maths.lse.ac.uk/Courses/MA314/matching.pdf)和(http://en.wikipedia.org/wiki/Hopcroft - Karp_algorithm)。
答案 2 :(得分:1)
QuickGraph库包含一个二分匹配算法,我刚刚处理并检查了修复程序。它包装了Edmonds Karp最大流量算法。
到目前为止,该算法的唯一文档是我添加的单元测试。如果有人想添加一个(希望更快)实现,而不是简单地包装maxflow算法,请与我联系。
答案 3 :(得分:0)
以下是最大二分匹配的流算法的实验研究:
@article{cherkassky98,
author = {Boris V. Cherkassky and Andrew V. Goldberg and Paul Martin and Joao C. Setubal and Jorge Stolfi},
title = {Augment or Push: A Computational Study of Bipartite Matching and Unit Capacity Flow Algorithms},
journal = {Journal of Experimental Algorithmics},
volume = 3,
number = 8,
year = 1998
}
获胜者是推送重新标记算法,我认为这是Andrew Goldberg的“BIM”软件包的实现,您可以在此处下载:
http://www.avglab.com/andrew/soft.html
请注意,如果您自己编写解决方案很重要,那么您可能想要满足于Ford-Fulkerson,正如Jesse建议的那样。如果你这样做,我建议你使用广度优先搜索,而不是深度优先搜索,找到增强路径(由于上面文章中解释的原因)。
答案 4 :(得分:-2)
#include<stdio.h>
#include<conio.h>
void main()
{
int m,n,x,y,i,j,i1,j1,maxvalue;
float s[10][10] = {0,0};
int s2[10][10] = {0,0};
float f[20][20] = {0,0};
float f1[20][20] = {0,0};
float f2[20][20] = {0,0};
printf("\nEnter Number of Jobs(rows) and Machines(columns) of Matrix:\n");
scanf_s("%d%d",&m,&n);
printf("\nEnter the Pij elements of matrix:\n");
for(x=1;x<m+1;++x)
for(y=1;y<n+1;++y)
scanf("%f", &s[x][y]);
//Find sum of each row
for(x=1;x<m+1;++x)
{
s[x][n+1]=0;
for(y=1;y<n+1;++y)
s[x][n+1]=s[x][n+1]+s[x][y];
//Find sum of each column
for(y=1;y<n+1;++y)
{
s[m+1][y]=0;
for(x=1;x<m+1;++x)
s[m+1][y]+=s[x][y];
}
printf("\nMatrix s, Row Sum (Last Column) and Column Sum (Last Row) : \n");
printf("\ns:\n");
for(x=1;x<m+2;++x)
{
for(y=1;y<n+2;++y)
printf(" %2.0f " , s[x][y]);
printf("\n");
}
//Print sum of each column
/*x=n+1;
for(y=1;y<m+1;++y)
printf(" %2.0f " , s[x][y]);*/
printf("\n");
maxvalue = s[1][1];
for(x=1; x<m+2; ++x)
for(y=1; y<n+2; ++y)
{
if(maxvalue < s[x+1][y+1])
maxvalue = s[x+1][y+1];
}
printf("\n");
printf("maxvalue = %d" , maxvalue);
printf("\nd1:\n");
float d1[20][20] = {0,0};
for(i=1;i<=m;++i)
{
for(j=1;j<=m;++j)
{
if(i==j)
d1[i][j] = maxvalue - s[i][n+1];
printf(" %2.0f " , d1[i][j]);
}
printf("\n");
}
printf("\nd2\n");
float d2[20][20] = {0,0};
for(i=1;i<=n;++i)
{
for(j=1;j<=n;++j)
{
if(i==j)
d2[i][j] = maxvalue - s[m+1][j];
printf(" %2.0f " , d2[i][j]);
}
printf("\n");
}
//row diff:
printf("\n\nRow diff:\n");
float r[20]= {0};
for(i=1;i<=n;i++)
for(j=1;j<=n;j++)
{
if(i == j)
{
r[i] = maxvalue - d2[i][j];
printf("%f ",r[i]);
}
}
//col diff:
printf("\n\nCol diff:\n");
float c[20]= {0};
for(i=1;i<=m;i++)
for(j=1;j<=m;j++)
{
if(i == j)
{
c[i] = maxvalue - d1[i][j];
printf("%f ",c[i]);
}
}
//assignment matrix:
float am[20][20]={0};
i=j=1;
ITERATION1:
if((c[i]<r[j]) && i<=m && j<=n)
{
am[j][i]=c[i];
r[j]=r[j]-c[i];
c[i]=0;
i++;
}
else if((c[i]>r[j]) && i<=m && j<=n)
{
am[j][i]=r[j];
c[i]=c[i]-r[j];
r[j]=0;
j++;
}
else if((c[i]==r[j]) && i<=m && j<=n)
{
am[j][i]=r[j];
c[i]=r[j]=0;
i++;j++;
}
else
goto END;
for(int z=0;z<=n;z++)
{
if(c[z]==0)
continue;
else
goto ITERATION1;
}
for(int b=0;b<=m;b++)
{
if(r[b]==0)
continue;
else
goto ITERATION1;
}
END:
printf("\n\nASSIGNMENT MATRIX:\n");
for(i=1;i<=n;i++)
{
for(j=1;j<=m;j++)
{
printf(" %2.0f ",am[i][j]);
}
printf("\n");
}
printf("\n\nf:\n");
for(i=1; i<(m+n)+1;++i)
{
for(j=1;j<(m+n)+1;++j)
{
if((i<=m) && (j<=n))
{
f[i][j]=s[i][j];
}
if((i<=m)&&(j>n))
{
f[i][j] = d1[i][j-n];
}
if((i>m)&&(j<=n))
{
f[i][j] = d2[i-m][j];
}
if((i>m)&&(j>n))
{
f[i][j] = am[i-m][j-n];
}
printf(" %2.0f " , f[i][j]);
}
printf("\n");
}
//printf("\n\nf1:\n");
for(i=1; i<(m+n)+1;++i)
{
for(j=1;j<(m+n)+1;++j)
{
f1[i][j]=f[i][j];
//printf(" %2.0f " , f1[i][j]);
}
//printf("\n");
}
int cnt = 0;
ITERATION2:
for(i=1; i<(m+n)+1;++i)
{
for(j=1;j<(m+n)+1;++j)
{
f2[i][j] = -1;
}
}
for(i=1; i<(m+n)+1;++i)
{
for(j=1;j<(m+n)+1;++j)
{
if(f1[i][j]!=0 && f2[i][j]!=0)
{
f2[i][j] = f1[i][j];
for(j1=j+1;j1<(m+n)+1;++j1)
f2[i][j1] = 0;
for(i1=i+1;i1<(m+n)+1;++i1)
f2[i1][j] = 0;
}
}
}
//printf("\n\nf2:\n");
for(i=1; i<(m+n)+1;++i)
{
for(j=1;j<(m+n)+1;++j)
{
if(f2[i][j] == -1)
{
f2[i][j] = 0;
}
//printf(" %2.0f " , f2[i][j]);
}
//printf("\n");
}
//printf("\n\nf1:\n");
for(i=1; i<(m+n)+1;++i)
{
for(j=1;j<(m+n)+1;++j)
{
if(f2[i][j] != 0)
{
f1[i][j] = f1[i][j] - 1;
}
//printf(" %2.0f " , f1[i][j]);
}
//printf("\n");
}
cnt++;
printf("\nITERATION - %d", cnt);
printf("\n\Gant Chart:\n");
for(i=1; i<=m;++i)
{
for(j=1;j<=n;++j)
{
if(f2[i][j] != 0)
{
s2[i][cnt] = j;
printf(" J%d -> M%d", i,j);
}
}
printf("\n");
}
int sum = 1;
for(i=1; i<(m+n)+1;++i)
{
for(j=1;j<(m+n)+1;++j)
{
sum = sum + f1[i][j];
}
}
if(sum>1)
goto ITERATION2;
else
goto END2;
END2:
printf("\n\Final Gant Chart:\n");
for(i=1; i<=m;++i)
{
for(j=0;j<=cnt;++j)
{
if(j == 0 )
printf(" J%d -> ", i);
else
{
if(s2[i][j] !=0)
printf(" M%d ", s2[i][j]);
else
printf(" %2c ", ' ');
}
}
printf("\n");
}
getch();
}