所以,这与下面的问题有关。我找到了一种完成数据集合并的新方法。在SQL中,我单独导入了8个数据集(固定宽度的文本文件),然后使用union合并它们。据我所知,union删除了重复项。我使用下面给出的代码来做到这一点。
当我使用UNION ALL时,我得到了6755条记录。 UNION返回6669.这告诉我sql删除了86个重复项。就像仔细检查一样,我将文本文件逐个导入excel,然后将它们组合起来。从那里,我连接主键字段(其中有9个),然后删除重复项。 Excel删除107.任何人都可以想到一个原因,当我尝试删除重复项时,为什么我会得到不同的结果。
SELECT x.*
INTO [industrytempa]
FROM (SELECT * FROM industry21
UNION
SELECT * FROM industry31
UNION
SELECT * FROM industry41
UNION
SELECT * FROM industry51
UNION
SELECT * FROM industry24
UNION
SELECT * FROM industry34
UNION
SELECT * FROM industry44
UNION
SELECT * FROM industry54
) x