我正在研究DRAGNN,这是SyntaxNet的更新框架。
论文:https://arxiv.org/pdf/1703.04474.pdf
代码&文档:https://github.com/tensorflow/models/tree/master/research/syntaxnet
在设计DRAGNN时,关键是在TBRU内部和跨TBRU(DRAGNN的子单元)选择正确的递归函数'r(si)'。作者列举了一些不同用例的递归函数的例子,例如: arc-standard依赖解析。然而,他们并没有真正解释选择这些功能的理由。
人们通常如何决定在应用DRAGNN时使用哪种递归函数?是否有一种很好的方法来提出递归函数的假设并对其进行测试?或者每个人都只使用DRAGNN作为代码中预定义的用例,具有预定义的递归函数? (对不起,代码非常复杂,所以我很难理解如何使用它)
似乎如果你没有关于递归函数有效的先验直觉,最好注意注意力,这本质上是将每个状态与所有先前时间步骤相关联的“最大”递归函数,计算成本高
如果我遗漏了关于DRAGNN目的和使用的基本信息,请道歉 - 请纠正我。