我想使用大数据方法对这些文件进行一些分析。
将我的整批文件从XML转换为JSON(超过100k文件,分为2个文件夹)后,我意识到在第一个目录中我缩短了2个文件,在第二个目录中我意识到了短7个文件。
转换是通过Mac OS上的shell scrips完成的,我想问你,如何构建另一个脚本,通过比较两个文件夹中的文件来检查哪些文件丢失。我需要快速,因为获取一个文件的每个名称并交叉检查与另一个文件夹中的整个文件数量不是一个可行的选择。
是否有一些shell命令,或者是否有人有一个解决此类问题的脚本。
提前thx !!干杯,
维拉德