我目前正在与lstm合作。我有一个有关交易信息的许多句子的数据集,我想提取信息,假设金额,日期和transactionWith。我已经尝试过基本的lstm,其中我的系统尝试将给定序列的每个单词预测为数量,日期,transactionWith或无关紧要的单词。
我已经按照如下方式制作了训练数据:
输入:
您在2018年8月13日给了约翰100.00
目标:(标有每个单词)
ir ir金额ir transactionWith ir date
您会看到整个数据集都有很多“ ir”或不相关的标签,我认为这会使我的系统偏向于预测测试数据的“ ir”。
现在,我想尝试使用tensorflow的seq2seq模型,其中输入是事务性句子,目标是提取信息的seq。这样的例子-
输入:
您在2018年8月13日给了约翰100.00欧元。
目标:
100.00 13-08-2018约翰
这里所有目标seq都将保持固定格式,例如第一个是金额,第二个是日期,第三个是transactionWith等。
我可以像使用输入编码器的编码器和目标序列的解码器的语言翻译模型那样来执行此操作吗?如何确保测试数据的预测序列来自给定单个输入语句的词汇表而不是来自整个目标词汇表?
提前谢谢大家。 :)