是否可以将字符串预处理包括到Keras嵌入层中,这样我就可以在不先对其进行预处理的情况下为该层提供字符串?
默认的Embedding
层需要整数矢量(来自标记化语句),而且我无法找到有关如何扩展或包装该层以使字符串预处理由模型完成的良好示例或文档本身。我认为这还需要某种方式来包含词汇。
我最近在模型中使用了nnlm-en-dim128
TensorFlow Hub模块,我想知道它如何直接在字符串上而不是向量上工作,所以我知道通常在TensorFlow中应该可行(例如,通过{{ 3}}操作)。我想重现与该模块类似的网络体系结构,以了解其工作原理,但是我还没有找到一个很好的示例或文档。