标签: nlp corpus
它们之间有什么区别,它们可以分别用于什么?
答案 0 :(得分:3)
可比较语料库是两种不同语言的语料库,它们来自同一个域,如Statistical Machine Translation Survey Wiki中所定义。
平行语料库是特定类型的可比语料库,其中文本与其翻译成第二语言配对。有许多机器翻译文件假定这个定义。例如,Europarl Project的主要论文。