这是我的问题:
鉴于T={CTAGC, GAGCG, AGCGG, CGGAG}
,使用贪婪算法,超弦S
将为GAGCGGAG
。
以下是我的解决方案的伪代码:
Algorithm greedy
Sort edges in decreasing weight order (weight mean the number of overlap between 2 substrings)
Initialize the Set empty
For each edge in this order
If the edge does not form a cycle
and the edge does not start or end at the same node as another edge in the Set
then
add the edge to the current Set
End for
End Algorithm
从S
开始,三元组合将以s = {GAG, AGC, GCG, CGG, GGA, GAG}
的形式给出。
重复GAG
。
如果使用s
使用哈密顿方法检索超弦,是否会使用或省略重复的单词?
如果省略重复的单词,那么GAG
,AGC
,GCG
,CGG
,GGA
构建的GAGCGGA
将成为{{1}}。
因此,贪婪方法和哈密顿方法将在超弦中提供不同的结果。
为什么他们不一样?在我的研究中,我发现的所有例子都表明组合中没有重复的单词,所以如果我使用哈密顿方法重建超弦,贪婪和哈密顿方法的结果将是相同的。但重复的话呢?