标签: c linux filesystems hashtable
我正在尝试编写一个C程序来搜索重复文件,对文件进行分组,然后返回任何重复的文件。用户可以输入文件路径或指定要从命令行(argc)检查使用的文件。我将使用stat()来遍历系统,我知道我需要使用哈希表来存储文件。但是,我有点迷失了如何做以实际检查文件是否重复。
我知道有些程序会为你做这件事,但这是我需要完成的学术练习。我不是在寻找编码答案,只是更高层次的答案,我应该如何解决问题。任何反馈都表示赞赏,包括除了上面列出的建议之外的任何建议(同样,我必须从头开始编写这个程序)。
感谢。