从有时重复的数字列表中获取所有间隔

时间:2014-09-25 12:31:29

标签: list file math numbers missing-data

我想找到一种从文件列表中获取所有间隔的方法。这些文件代表扫描文档的页面。有时文档有几页,文档的数量会出现几次,但大多数时候文档只有一页。我想知道的是扫描了哪些文件,哪些没有,列表中缺少哪些数字。

文件列表如下所示:

00001_DCT.jpeg
00002_DCT.jpeg
00003_1d2_DCT.jpeg
00003_2d2_DCT.jpeg
00004_1d3_DCT.jpeg
00004_2d3_DCT.jpeg
00004_3d3_DCT.jpeg
00005_1d9_DCT.jpeg
00005_2d9_DCT.jpeg
00005_3d9_DCT.jpeg
00005_4d9_DCT.jpeg
00005_5d9_DCT.jpeg
00005_6d9_DCT.jpeg
00005_7d9_DCT.jpeg
00005_8d9_DCT.jpeg
00005_9d9_DCT.jpeg
00006_1d4_DCT.jpeg
00006_2d4_DCT.jpeg
00006_3d4_DCT.jpeg
00006_4d4_DCT.jpeg
00007_DCT.jpeg
00008_DCT.jpeg
00009.jpeg
00010.jpeg

直到

24679.jpeg
24680_1d3.jpeg
24680_2d3.jpeg
24680_3d3.jpeg
24681_1d2.jpeg
24681_2d2_dct.jpeg
24682.jpeg
24683_1d2.jpeg
24683_2d2.jpeg

哪种方法可以更轻松地找到丢失的数字?

1 个答案:

答案 0 :(得分:0)

我假设如果扫描文档,则会完全扫描(即不会从1d3到3d3)。

循环浏览文件名,将前5个字符转换为数字。确保当前文件编号仅比前一个文件编号大1或0.如果不满足该情况,则会中断(当前文件编号与前一个文件编号之间的所有文件都丢失)。