使用尽可能少的步骤转换序列

时间:2014-12-24 11:27:52

标签: python algorithm levenshtein-distance constraint-programming register-allocation

我的问题是,我应该使用什么算法来实现一个函数 translate根据以下Python示例工作:

>>> translate('aa', 'a')
[('S', -1)]
>>> translate('a', 'aa')
[('R', 0, 'x'), ('S', 1), ('W', 0, 'x')]
>>> translate('abc', bca')
[('R', 0, 'x'), ('R', 1, 'y'), ('R', 2, 'z'),
 ('W', 2, 'x'), ('W', 0, 'y'), ('W', 1, 'z')]
>>> translate('abc', 'cabc')
[('R', 2, 'x'), ('S', 1), ('W', 0, 'x')]
>>> translate('ab', 'bab')
[('R', 1, 'x'), ('S', 1), ('W', 0, 'x')]
>>> translate('abc', 'bcabc')
[('R', 1, 'x'), ('R', 2, 'y'), ('S', 2), ('W', 0, 'x'), ('W', 1, 'y')]

它是与生成最佳代码相关的问题的概括 在我拥有的编译器中。算法就是我之后的那个 解决方案不一定必须在Python中。在"现实"该 变量(上面的'x''y''z')是机器寄存器 和字符串索引堆栈位置。

从示例中可以看出,算法是关于转换a 使用最少的字符串从一个字符序列到另一个字符串 步数。需要注意的是,只有三种可能 可供选择的操作:

  1. 将字符串向左或向右移动N个步骤。如果是的话 转移到右边,引入的新指数充满了 ?个字符。 E.g ('S', 2) - 将字符串两个索引移位到 右边。
  2. 将索引处的字符读入变量。这个操作不能 如果字符串中有任何?个字符,则执行。例如 ('R', 4, 'q') - 读取索引4处的字符并将其存储在 变量q
  3. 将字符从变量写入目标字符串的索引。该 index必须在bounds范围内。 E.g ('W', 1, 'q') - 写下角色 字符串中索引0处的变量q
  4. 这是实现这些操作的简单Python代码 从abbab的转换示例 手动执行:

    def shift(str, n): return str[-n:] if n < 0 else '?'*n + str
    def read(str, n): assert not '?' in str; return str[n]
    def write(str, n, ch): return str[:n] + ch + str[n:]
    
    S = 'ab'
    x = read(S, 1)
    S = shift(S, 1)
    S = write(S, 0, x)
    

    这一系列步骤将对应于解决方案 [('R', 1, 'x'), ('S', 1), ('W', 0, 'x')]

    我觉得这个问题之间有一些相似之处 levenshtein编辑距离,但我无法弄明白。那么就可以了 为我写translate算法?

    如果此问题描述不够清楚,我会添加更多示例 但我希望是。

1 个答案:

答案 0 :(得分:0)

首先,我想我修复了你的Python代码。这是一个可以运行一系列步骤并给出结果的类。您的示例在结果中留下了?,我认为这不应该发生。

这里是SequenceRunner

class SequenceRunner:

    def __init__(self):
        self.INSTRUCTIONS = {
            'R': self.read,
            'S': self.shift,
            'W': self.write
            }

    def set(self, S):
        self.S = S[::-1]

    def shift(self, n):
        self.S = self.S[-n:] if n < 0 else  '?'*n + self.S

    def read(self, n, v):
        assert not '?' in self.S; return self.S[n]

    def write(self, n, v):
        v = getattr(self, v)
        self.S = self.S[:n] + v + self.S[n+1:]

    def run(self, program):
        for line in program:
            func = self.INSTRUCTIONS[line[0]]
            args = line[1:]
            result = func(*args)
            if result:
                setattr(self, args[-1], result)

    def get(self):
        return self.S[::-1]

以下是如何使用它

c = SequenceRunner()
program = [('R', 1, 'x'), ('S', 1), ('W', 0, 'x')]
c.set('ab')
c.run(program)
print c.get()

问题所以我理解得更好:您是否需要一种算法来推断从一个字符串到另一个字符串所需的(最少量)步骤?