在c ++中设计一个非确定性有限自动机(输出不正确)

时间:2012-05-16 20:44:27

标签: c++ nfa automaton

我正在做一个模拟非确定性有限自动机的任务,正如我在post中解释的那样。我从文件tarea4.in中读取了此输入:

1
6 8 0 2
2
5
0 0 a
0 1 a
1 1 b
1 2 c
1 3 c
3 4 d
4 4 d
4 5 d
5
aaabcccc
aabbbbcdc
abbcdddcc
acdddddd
abc

第一行输入是整数T,表示评估程序的个案数。每个测试用例以4个整数开始,第一个是自动机的状态数,接下来是自动机的转换数,第三个数是初始状态,然后是最终状态数。然后是最终状态(在示例中,最终状态是2和5)。然后是F行,每行有一个整数E,表示E是最终状态。

然后是N行(N是转换次数),每行有2个整数和一个字符I,J和C,表示转换的状态,即转换从状态i进入状态J字符C.在这一行之后加上一个整数S,它将包含要测试的字符串数,然后是包含相应字符串的S行。

预期输出为:

Test Case #2:
aaabcccc Rejected
aabbbbcdc Rejected
abbcdddcc Rejected
acdddddd Accepted
abc Accepted

输出结果是我的代码:

Test Case #1:
aaabcccc Rejected
aabbbbcdc Rejected
abbcdddcc Rejected
acdddddd Rejected
abc Rejected

这是我的代码:

#include <iostream>
#include <vector>
#include <map>
#include <set>
#include <utility>
#include <vector>    
using namespace std;

typedef map<pair<int, int>, char> transitions;
    transitions trans;

    int  numberFinals;
    vector<int> currentStates;    

int main (){ 

    freopen ("tarea4.in", "r", stdin);
    //freopen ("tarea4.out", "w", stdout);        
    int testCases, i, j,k, cont=1,finalStates,numberInputs,stateOrigin, stateDestination;
    int numberStates, numberTransitions, initialState;
    char transitionCharacter ;

    set<int> current;
    set<int> next;
    set<int>::iterator it;
    set <int> final;
    std::set<int> the_intersection;  // Destination of intersect
    map<pair<int, int>, char>::iterator p;
    string inputString;

    cin>> testCases;
    for (i=0;i< testCases;i++){
        cin>>numberStates>>numberTransitions>>initialState>>numberFinals;
        current.insert (initialState);

        for (j=0;j<numberFinals;j++){
            cin>>finalStates;
            final.insert(finalStates);
        }

        for (j=0; j<numberTransitions;j++){
            cin>> stateOrigin>>stateDestination>>transitionCharacter;
            trans.insert(transitions::value_type(std::make_pair(stateOrigin, stateDestination), transitionCharacter ));
       }

        cin>>numberInputs;

        cout<<"Test Case #"<<cont++<<":"<<endl;    

        for (j=0; j<numberInputs;j++){
             //////////////////the code of the answer /////////////////
            current.insert (initialState);
            cin>> inputString;
            cout<<inputString<<" ";


     for (k=0; k<str.size();k++){
         next.clear();
         for ( it=current.begin() ; it != current.end(); it++ ){
              for (q= trans.begin(); q!= trans.end();q++){
                  if((*it == q->first.first)&&(str[k]==q->second)){
                     next.insert(q->first.second);
                   }
              current=next;
              }
         }
     }

            std::set_intersection(current.begin(), current.end(), final.begin(), final.end(), std::inserter(the_intersection, the_intersection.end()));

            if (the_intersection.size()>0){
                cout<< "Accepted"<<endl;
            }
            else{
                cout<< "Rejected"<<endl;
            }

        }

        printf ("\n");
    }

return 0;
}

我的问题是:为什么输出不正确?我认为它是针对测试用例中定义的自动机的非确定性,但我如何才能正确评估字符串?我如何将我的函数evaluate_string更改为以某种方式检查可以使自动机通过非确定性来评估字符串的不同路径?

我已经坚持了好几天,老实说我有点绝望了。

3 个答案:

答案 0 :(得分:9)

评估NFA 几乎与评估DFA一样简单

在DFA中,您有一个当前状态,并在每个步骤中选择下一个转换。在输入结束时,检查当前状态是否为接受状态。

好吧,在NFA中,你有设置的当前状态,并且在每一步中你都要经历所有当前状态,并且对于每一个状态,你选择所有有效的转换。这些组合形成了你的新状态集。

最后,检查当前状态和接受状态的交集是否为非空。

在伪代码中,这看起来如下:

  • 当前 = { initial }
  • 对于 输入中的每个 char
    • next = {}
    • 对于 当前中的每个
      • 每次 过渡 过渡 [] [ char ]∪过渡 [] [ε]:
        • 的。的追加的( target_of 的(过渡的))
    • 当前 = next
  • if len 交叉点当前接受))&gt; 0:
    • 打印 "String accepted"
  • 其他
    • 打印 "String rejected"

这可以将逐行翻译成C ++代码。为方便起见,我建议std::set<int>current使用next,转换使用std::multimap<char, int>矢量。这假设每个状态对应一个整数。

答案 1 :(得分:1)

我认为您应该首先实现将任何NFA转换为其相应DFA的一般机制。在这之后,您可以轻松实现自动机运行器,因为DFA确定性地工作。

答案 2 :(得分:1)

基本问题是,一旦找到FIRST有效转换,您的代码就会突破转换循环。如果您正在执行DFA,哪个可行,但NFA可能有多个有效路径。

你有两个选择(我相信还有更多):

1)实现NFA评估器:这涉及跟踪一组当前状态,并针对每个状态评估每个输入字符。读取字符串后,如果集合中有任何最终状态,则表示已完成。

2)将NFA转换为DFA,这是恕我直言的更难的方法,因为这基本上涉及构建相同的设置逻辑并评估新状态的转换。