斯坦福词汇化分析器负载模型错误

时间:2014-06-06 14:41:57

标签: stanford-nlp

我在visual studio 2012上使用C#上的NLP Parser。 NuGet安装好了,可以编译简单的例子。 我注意到了模型加载器的一个问题:

        try
        {
            System.Console.WriteLine(System.IO.File.Exists(full) ? "File exists." : "File does not exist.");
            LexicalizedParser lp = LexicalizedParser.loadModel(full);
            lp.setOptionFlags(new String[] { "-maxLength", "80", "-retainTmpSubcategories" });
            //if (!String.IsNullOrEmpty(fileName))
            //DemoDP(lp, fileName);
            //else
            DemoAPI(lp);
        }
        catch (Exception e)
        {
            System.Console.WriteLine(e.Message);
            throw e;
        }

我得到某种文件读取格式错误:

C:\ NLPTest \ bin \ x86 \ Debug \ englishPCFG.ser.gz:期待BEGIN块;得到??

模型文件大约是8 MB,但我不知道这个模型文件的格式。 在某处我可以下载一个肯定有用的官方文件吗?

1 个答案:

答案 0 :(得分:6)

对,我发现了这个问题,因为怀疑它是由于模型的旧格式造成的。 我解决它的方式是:

  • 下载项目文件版本2013
  • 打开名为stanford-parser-3.2.0-models
  • 的jar文件
  • 提取englishPCFG.ser.gz
  • 发音abracadabra并且没有更多格式错误

希望它可以帮助其他人!