我是NLP初学者。我正在执行一项任务,其中必须处理文本以绘制形状。
我做了一些研究,发现tokensregex可能很合适。
例如
文字:您能否绘制一个等腰三角形,高度为150,底数为100。
在这里,我的方法是编写tokensregex规则以提取形状名称和尺寸。一旦获得了这两个数据,就将绘制具有给定尺寸的形状。
我选择使用tokensregex是否正确?
还是有其他方法可以巧妙地做到这一点?
答案 0 :(得分:2)
鉴于问题的明确界限,Tokensregex可能是正确的选择。您可能会花一些时间使其成熟。但这应该是首选方式。但是,在最终确定方法之前,建议您将其与某些deep parsing技术结合使用。这是您可以与一些已知形状的字典结合并编写提取逻辑的结果。
(ROOT
(SQ (MD Could)
(NP (PRP you))
(VP (VB please)
(VP (VB draw)
(NP (DT an) (NNP Isosceles) (NN triangle))
(PP (IN with)
(NP
(NP
(NP (DT an) (NN altitude))
(PP (IN of)
(NP (CD 150))))
(CC and)
(NP
(NP (DT a) (NN base))
(PP (IN of)
(NP (CD 100))))))))
(. .)))
在这里,您将获得现成的海拔高度-150,基本-100。看看是否有帮助。
答案 1 :(得分:1)
没有正确的方法来完成您要问的事情。如果您所有的句子都与示例中的语句相同,那么具有依赖项解析的基于规则的方法似乎是一种解决方案,其中规则标识属性和值,而依赖项解析标识它们之间的关系。
更正式地说,在这种情况下,semantic parsing应该有所帮助