应用错误收集

时间：2015-01-20 10:05:59

标签： algorithm

我想知道是否存在针对以下问题的已知算法/解决方案。

我有一组来自X系列的10000个文件和来自Y系列的另外10000个文件。按族，我的意思是文件彼此密切相关（在代码共享方面）。

我希望发现家族X中所有（或大多数）文件中存在的独特序列（DNA），但不会在Y家族中退出。

我如何提取这样的DNA？

答案 0 :(得分：0)

如果我理解正确，我相信这是解决方案：

注意：在您的DNA课程中（或在您的课程中，依赖于您正在使用的语言）记住要照顾平等和散列。