机器翻译中单词对齐的格式是什么?

时间:2016-06-23 03:54:12

标签: machine-learning nlp language-translation machine-translation

我正在阅读this论文,并且难以理解单词对齐的表示方式。确切地说,在4.1部分下方,作者说对齐的格式为(i,j),其中i范围在源句长度内,j范围在目标句子中范围。这意味着每个对齐是一对两个数字,假设句子通常不超过40-100个单词,ij的值可以使用short类型存储。因此,我希望看到存储这些对齐所需的空间量为2 x sizeof(short) x number of word alignments。但是,如果您转到下一页4.2的上方,则表示空格为sizeof(short) x number of word alignments。为什么?我混淆了什么?

0 个答案:

没有答案