我使用NLTK使用基于特征的cfg从英文文本中获取sql查询。我点了这个链接http://www.nltk.org/book/ch10.html。我可以运行fcfg存储在sql0.fcfg文件中的示例。
之后我尝试修改它以供我自己使用,其中我添加了以下一组新规则:
% start S
## Added by me
S[SEM=(?whadvp + ?sq)] -> WHADVP[SEM=?whadvp] SQ[SEM=?sq]
WHADVP[SEM=(?wrb + ?jj)] -> WRB[SEM=?wrb] JJ[SEM=?jj]
SQ[SEM=(?vbp + ?np + ?vp)] -> VBP[SEM=?vbp] NP[SEM=?np] VP[SEM=?vp]
NP[SEM=(?np + ?pp)] -> NP[SEM=?np] PP[SEM=?pp]
NP[SEM=(?np)] -> JJS[SEM=?jjs]
VP[SEM=(?vbz + ?advp)] -> VBZ[SEM=?vbz] ADVP[SEM=?advp]
PP[SEM=(?in + ?np)] -> IN[SEM=?in] NP[SEM=?np]
NP[SEM=(?prp + ?nn)] -> PRP$[SEM=?prp] NN[SEM=?nn]
ADVP[SEM=(?rb)] -> RB[SEM=?rb]
WRB[SEM='SELECT average(calldurationinsexonds) FROM Task'] -> 'How'
JJ[SEM=''] -> 'long'
VBP[SEM=''] -> 'do'
JJS[SEM=''] -> 'most'
IN[SEM=''] -> 'of'
PRP$[SEM=''] -> 'our'
NN[SEM=''] -> 'phone'
VBZ[SEM=''] -> 'calls'
JJ[SEM=''] -> 'last'
## Default example
S[SEM=(?np + WHERE + ?vp)] -> NP[SEM=?np] VP[SEM=?vp]
VP[SEM=(?v + ?pp)] -> IV[SEM=?v] PP[SEM=?pp]
VP[SEM=(?v + ?ap)] -> IV[SEM=?v] AP[SEM=?ap]
NP[SEM=(?det + ?n)] -> Det[SEM=?det] N[SEM=?n]
PP[SEM=(?p + ?np)] -> P[SEM=?p] NP[SEM=?np]
AP[SEM=?pp] -> A[SEM=?a] PP[SEM=?pp]
NP[SEM='Country="greece"'] -> 'Greece'
NP[SEM='Country="china"'] -> 'China'
Det[SEM='SELECT'] -> 'Which' | 'What'
N[SEM='City FROM city_table'] -> 'cities'
IV[SEM=''] -> 'are'
A[SEM=''] -> 'located'
P[SEM=''] -> 'in'
保存文件后,当我执行以下命令时,我遇到了错误
cp = load_parser('grammars/book_grammars/sql0.fcfg')
query = 'How long do most of our phone calls last'
trees = list(cp.parse(query.split()))
错误:
回溯(最近一次呼叫最后一次):文件"",第1行,in 文件" C:\ Python27 \ lib \ site-packages \ nltk \ parse \ chart.py", 第1350行,在解析中 chart = self.chart_parse(tokens)File" C:\ Python27 \ lib \ site-packages \ nltk \ parse \ chart.py",第1309行,in chart_parse self._grammar.check_coverage(tokens)File" C:\ Python27 \ lib \ site-packages \ nltk \ grammar.py",第631行,in check_coverage "输入字词:%r。"缺少%)ValueError:语法不包括一些输入词:u"'',' long',' do','大多数',',','我们的', '打电话','打电话','打电话'"。
我不知道我添加的语法或其他问题是否有错误。任何帮助或建议都会很棒。
答案 0 :(得分:0)
问题是我正在修改\ grammars \ book_grammars \ sql0.fcfg。当我把它保存为单独的文件并从那里加载语法时,问题就解决了。
不知道为什么会这样,但它解决了这个问题。