在列表中找到类似的字符串并计算它们 - 也许是现有软件?

时间:2015-07-13 15:20:41

标签: excel vba

我有问题。所以我有以下格式的excel列表:


Columbia University           | YES 
Washington University         | YES 
University of Columbia        | NO 
Columbia Uni                  | NO 
Columbia University, New York | YES 
Washington Uni                | NO 
Columbia University           | YES 
University of Washington      | YES 
Washington University         | YES 
Washington Uni                | NO 


结果应如下

Columbia University | 3 X YES 
Washington University | 3 X YES 

现在的挑战是告诉程序/软件这些代表同一所大学的不同字符串实际上是相同的。您是否了解自动学习的程序?也许给程序用户一些建议,如:这可能是哥伦比亚大学,对吗?

如果某人有解决方案,那就太棒了。如果您知道可以解决问题的现有程序,我真的不介意吗?那会更好!

非常感谢你的帮助!

曼努埃尔

2 个答案:

答案 0 :(得分:0)

想一想,你可以有一个帮助表,在一个列中列出唯一的大学,在右边的单元格中列出“实际等价物”。 IE:

Columbia University     Columbia University
Columbia Uni            Columbia University
Washington Uni          Washington University
Washington University   Washington University

只需使用像Vlookup这样的东西来返回“Actual”大学。太多了吗?它不会完全“学习”,但它会让你在同一时间。随着越来越多的学院/名称,您的列表将更加强大。

答案 1 :(得分:0)

如下列A和B列

的数据
$result = mysql_query("SELECT Email, UserPassword FROM tblnewusers WHERE Email = ?");
$con=new mysqli($dbhost, $dbuser, $dbpass, $yourDatabase);
$stmt = $mysqli->prepare($result);
$stmt->bind("s",$email);
$result=$stmt->execute();

然后在Col C中使用

Col A                         |Col B|Col C|Col D     |Col E 
Columbia University           |  YES|YES  |Columbia  |3
Washington University         |  YES|YES  |Washington|3
University of Columbia        |  NO |NO   | 
Columbia Uni                  |  NO |NO   |             
Columbia University, New York |  YES|YES  |         
Washington Uni                |  NO |NO   |         
Columbia University           |  YES|YES  |             
University of Washington      |  YES|YES  |             
Washington University         |  YES|YES  |             
Washington Uni                |  NO |NO   |         

然后在Col D中写下大学名称,在下面的E栏中使用

=TRIM(B1)