我有一个巨大的破碎链接列表,我用Screaming Frog生成并开始修复它们很多..我通过尖叫青蛙运行csv文件,看看我留下了哪些断开的链接,所以现在我有2个CSV文件。如何从旧列表中减去较新的列表,以便查看已修复的链接?
答案 0 :(得分:1)
将两个CSV导入Excel。
将公式添加到较大列表的B列的单元格中:=COUNTIF(Sheet2!A:A,A1)
这将为您计算该单元格在另一个列表中出现的次数。
现在你只需删除任何有计数> 0
提示:要轻松删除行:添加标题行,启用自动过滤器,取消选择计数0,删除行,关闭自动过滤器。 (或者,如果您不清楚订单搞砸了,您可以对列表进行排序)
答案 1 :(得分:0)
在Excel中尝试此功能:
=IF(COUNTIFS($B$1:$B$6, A1), "Borked", "Fixed")
确保A值指向较小列表中的某些内容(仍然已损坏),B范围涵盖原始的断开链接集
答案 2 :(得分:0)
以下方法假定:
答:所有损坏的链接都在oldfile中。 B:一些损坏的链接在newfile中。 C:共享行是完全重复的。
sort newfile oldfile | uniq -d > filesThatAreStillBroken
或
sort newfile oldfile | uniq -u > filesThatAreFixed
Sort将文件合并为一个排序列表。如果newfile或oldfile是第一个没关系。
uniq -d仅输出多次出现的行。由于他们在两个名单中,他们仍然被打破。
uniq -u推出只有线是唯一的。
注意:这不会捕获您在修复旧错误时引入的新错误。新错误只会出现在新文件中,因此会在第二次调用时错误地报告为已修复,并且在第一次调用时根本不报告。
类型
man sort
man uniq
有关这两个命令行实用程序的更多详细信息。
如果你在Windows框中,你可以安装cygwin环境,或者windows现在可能有一个posix命令集。