合并具有不同BUT相似列标题的CSV文件

时间:2020-02-26 23:57:33

标签: sql csv

我有大约5000个CSV文件,它们都有不同但相似的列。类似于以下两个表摘要:

Table1:

First Name,Last Name,email

Table2:

first_name,last_name,e-mail

我尝试使用Levenshtein距离将表中的所有列映射到主列表标题。它可以正常工作,但不是很准确,如果没有很好的匹配,有时我会丢失数据。有没有做这种事情的工具?还是我写的这个工具可能是我必须要做的最好的选择。

0 个答案:

没有答案