作为研究论文的一部分,我想在云中实现文件级重复数据删除程序。在继续进行这项研究之前,我需要首先了解哪些基础知识。
我已经阅读了有关云中重复数据删除技术,技术类型和涉及的哈希的一些研究或白皮书。我已经了解了文件级重复数据删除的算法。现在,我只想开发一个能够使用md5校验和执行文件级重复数据删除的程序。我试图四处寻找示例程序或应该涵盖的基本知识,但我无法获得任何资源。
- 哪种编程语言适合实施此类程序?我已经读过,其中大多数使用Java,但我对其他语言(例如C或Python)是否可以实现感到好奇?如果要使用Java,应该重点关注Java的哪个领域或功能。
- 除了该计划外,我还需要注意哪些问题?我应该使用哪种类型的云,是否需要为此创建数据库服务器?
- md5是否适合此文件级重复数据删除。我已经阅读了很多文章,声称md5比SHA-1快,但它并不安全。