在Windows(本例中为XP)中基于filespec删除(附近)重复文件的最佳脚本方法是什么?我正在考虑RegEX和一些VB脚本但是如果有更好的方法......
示例包括slighlty名称不同的文件名,或者末尾有一个或两个(已知的)额外字符,或者是大小相同但大小相同,文件大小也不同......等等。
如果边界已知,正则表达式是处理这些差异的最佳方法。
答案 0 :(得分:2)
不,我不认为正则表达式是正确的工具。如果你问我,这听起来有点危险。 无论如何,您可以计算两个文件名之间的Levenshtein distance,如果足够小(请注意只包含几个字符的文件名!)删除其中一个。
可以使用简单的算法完成尺寸。
答案 1 :(得分:0)
您可以使用正则表达式匹配(或接近匹配)文件名。
我会使用正则表达式来匹配名称,并构建文件大小列表。您可以根据属于该差异的文件大小来计算差异。
在构建匹配文件列表后,您可以访问不同的文件属性(大小,日期等)来标记要删除的文件。