从另一个中减去CSV列表?

时间:2012-09-28 21:57:00

标签: excel csv numbers seo

我有一个巨大的破碎链接列表,我用Screaming Frog生成并开始修复它们很多..我通过尖叫青蛙运行csv文件,看看我留下了哪些断开的链接,所以现在我有2个CSV文件。如何从旧列表中减去较新的列表,以便查看已修复的链接?

3 个答案:

答案 0 :(得分:1)

将两个CSV导入Excel。

将公式添加到较大列表的B列的单元格中:=COUNTIF(Sheet2!A:A,A1)

这将为您计算该单元格在另一个列表中出现的次数。

现在你只需删除任何有计数> 0

提示:要轻松删除行:添加标题行,启用自动过滤器,取消选择计数0,删除行,关闭自动过滤器。 (或者,如果您不清楚订单搞砸了,您可以对列表进行排序)

答案 1 :(得分:0)

在Excel中尝试此功能:

=IF(COUNTIFS($B$1:$B$6, A1), "Borked", "Fixed")

确保A值指向较小列表中的某些内容(仍然已损坏),B范围涵盖原始的断开链接集

答案 2 :(得分:0)

以下方法假定:

答:所有损坏的链接都在oldfile中。 B:一些损坏的链接在newfile中。 C:共享行是完全重复的。

sort newfile oldfile | uniq -d > filesThatAreStillBroken

sort  newfile oldfile | uniq -u > filesThatAreFixed

Sort将文件合并为一个排序列表。如果newfile或oldfile是第一个没关系。

uniq -d仅输出多次出现的行。由于他们在两个名单中,他们仍然被打破。

uniq -u推出只有线是唯一的。

注意:这不会捕获您在修复旧错误时引入的新错误。新错误只会出现在新文件中,因此会在第二次调用时错误地报告为已修复,并且在第一次调用时根本不报告。

类型

man sort
man uniq 

有关这两个命令行实用程序的更多详细信息。

如果你在Windows框中,你可以安装cygwin环境,或者windows现在可能有一个posix命令集。