标签: algorithm
我想知道是否存在针对以下问题的已知算法/解决方案。
我有一组来自X系列的10000个文件和来自Y系列的另外10000个文件。 按族,我的意思是文件彼此密切相关(在代码共享方面)。
我希望发现家族X中所有(或大多数)文件中存在的独特序列(DNA),但不会在Y家族中退出。
我如何提取这样的DNA?
答案 0 :(得分:0)
如果我理解正确,我相信这是解决方案:
注意:在您的DNA课程中(或在您的课程中,依赖于您正在使用的语言)记住要照顾平等和散列。