有人可以告诉我有限状态传感器是什么吗?
我看过the Wikipedia article并且不理解。
答案 0 :(得分:45)
有限状态传感器(FST)是一种有限状态自动机(FSA,FA),它产生输出和读取输入,这意味着它对解析很有用(而“裸”FSA只能用于识别,即模式匹配)。
FST由有限数量的状态组成,这些状态通过标记为输入/输出对的转换链接。 FST以指定的开始状态开始,并根据输入跳转到不同的状态,同时根据其转换表生成输出。
FST在NLP和语音识别中很有用,因为它们具有很好的代数性质,最值得注意的是它们可以在组合下自由组合(形成代数),在常规关系上实现关系组合(将其视为非确定性函数)组成)同时保持非常紧凑。 FST可以在线性时间内将常规语言解析为字符串。
作为一个例子,我曾经将形态解析实现为一堆FST。我对动词的主要FST会将常规动词(称为“walked”)变为“walk + PAST”。我还有一个FST用于动词“to be”,它将“is”变成“be + PRESENT + 3rd”(第3个人),同样地用于其他不规则动词。使用FST编译器将所有FST组合成一个FST,其产生的单个FST远小于其部件的总和并且运行得非常快。 FST可以通过各种接受扩展正则表达式语法的工具构建。
答案 1 :(得分:9)
有限状态传感器本质上是一个有限状态自动机,可以在两个(或更多)磁带上工作。考虑传感器的最常见方式是作为一种“翻译机器”。他们从其中一个磁带上读取并写入另一个磁带。例如,这是一个将
的传感器a
转换为b
s:弧上的
a:b
表示在此过渡中,传感器从第一个磁带读取a
并将b
写入第二个磁带。
答案 2 :(得分:5)
用尽可能简单的术语,我理解FST本质上是一个“东西”,它根据输入磁带从一个状态移动到另一个状态并写入不同的输出磁带。磁带本质上是一组输入,如字符串中的字符。
整个FST由一组状态和它们之间的链接表示。当输入条件正确时,链接被“激活”,然后给出下一个状态调整后的磁带。
例如,假设FST以状态1的磁带abc
开头。状态2的链接与a
匹配,并将其更改为b
。这将被激活,将输出磁带设置为b
,并将剩余的bc
传递到状态2.如您所见,每个状态仅在存在其输入条件的链接时才会被激活是正确的,将剩余的输入传递给下一个状态,并写入单独的输出磁带。每个FST在磁带上运行一次并输出到另一个磁带一次。
要更清楚地了解它们read and take a look at the diagrams in this article(original broken link)。