我已经实现了CYK解析算法,该算法使用自下而上的方法来构建解析树。当它遍历算法时,最终解决方案的路径存储在后向指针中。从后台开始,我们构建树。最后一步是我遇到的问题。
这是我用来存储树的数据结构:
class GrammarTree(object):
def __init__(self, data):
self.data = data
self.left = None
self.right = None
def insertLeft(self, new_node):
self.left = GrammarTree(new_node)
def insertRight(self, new_node):
self.right = GrammarTree(new_node)
以下是我如何构建树,其中back
存储一个元组,其中split
是用于拆分树的索引,left_rule
和right_rule
是规则对于由int表示的相应树。如果到达叶子节点,则没有元组,只有一个表示终端规则的int。
def build_tree(start,end,idx,back):
tree = GrammarTree(idx)
node = back[start][end][idx]
if isinstance(node,tuple):
split,left_rule,right_rule = node
tree.insertLeft(build_tree(start,split,left_rule,back))
tree.insertRight(build_tree(split,end,right_rule,back))
return tree
else:
tree.insertLeft(GrammarTree(node))
return tree
问题是当构建树的功能完成时,会添加额外的分支,即节点没有正确粘合在一起。
这就是它的样子:
Lvl0 root
/ \
Lvl1 L1 R1
/ | \ / | \
/ | \ / | \
/ | \ / | \
/ | \ / | \
/ | \ / | \
Lvl2 L1.left=None L1.right=None L1.data R1.left=None R1.right=None R1.data
/ \ / \
Lvl3 L2 R2 L3 R3
树之间不应该有data
节点。
修改:
问题不在于存在额外的数据节点(上面的语句是错误的),而是在Lvl1之后,而不是在Lvl2上将新分支添加到L1.left/right
和R1.left/right
,它们被添加到L1
和R1's
data
字段。因此,L1/R1.data
最终成为一棵树,L1.left/right
和R1.left/right
未被使用,因此None
。
它应该是这样的:
root
/ \
/ \
L1=root.left R1=root.right
/ \ / \
/ \ / \
/ \ / \
L2=L1.left R2=L1.right L3=R1.left R3=R1.right
这就是我称之为构建树的地方:
back = [[[0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 6, 0, 3, 0, 2], [0, 0, 0, (1, 6, 7), 0, 3, 0, (1, 7, 7)], [0, 0, 0, (1, 6, 7), 0, (1, 7, 3), 0, (1, 7, 7)], [0, 0, 0, (1, 6, 7), 0, (2, 7, 3), 0, (1, 7, 7)]],\
[[0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 6, 0, 3, 0, 2], [0, 0, 0, (2, 6, 7), 0, (2, 7, 3), 0, (2, 7, 7)], [0, 0, 0, (2, 6, 7), 0, (2, 7, 3), 0, (3, 7, 7)]],\
[[0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 6, 0, 3, 0, 2], [0, 0, 0, (3, 6, 7), 0, 3, 0, (3, 7, 7)]],\
[[0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 6, 0, 3, 0, 2]],\
[[0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0]]]
build_tree(0,4,5,back)
答案 0 :(得分:0)
问题出在insertLeft()
类的insertRight()
和GrammarTree
方法中。您不是简单地连接分支,而是选择我正在调用GrammarTree
构造函数,因此我基本上将树包装在另一棵树中。
我通过删除对构造函数的调用来解决问题。
class GrammarTree(object):
def __init__(self, data):
self.data = data
self.left = None
self.right = None
def insertLeft(self, new_node):
self.left = new_node ## <- NOT GrammarTree(new_node)
def insertRight(self, new_node):
self.right = new_node ## <- NOT GrammarTree(new_node)