标签: tensorflow keras deep-learning training-data word-list
很常见,我过去经常使用会标的单词表来做训练数据集(每行仅包含1个单词)。但是,最近,我发现了一种使用Monogram和Bigram(2个单词/行)单词列表的培训方法,该单词列表使用GRU以及Tensorflow和Keras上的2个转换网络层。在训练集上使用会标,二元组甚至是连字有什么区别?