如何纠正错误的句子对齐(平行语料库)?

时间:2017-05-19 09:54:57

标签: alignment corpus sentence

我有一个平行语料库(pt-en),但它有一些对齐错误。通常因为葡萄牙语句子更长,而且翻译是由人类完成的(金标准),他们将句子缩减一半以便更好地理解。这种情况不会发生,但我需要一个完美的对齐来训练我的机器。

示例:(1-1);(2,3-2);(4 - 3);(5 - 4)

EN

  

1 - 一旦识别出具有高风险事件的个体,我们建议根据目前的预防指南对其进行治疗,主要是关于他汀类药物和乙酰水杨酸2的使用。

     

2 - 我们建议进一步研究确定女性冠状动脉钙化评分,评估更多高龄男性和不同社会阶层的男性比研究人群(中产阶级人群)更多。 / p>      

3 - 我们还建议将巴西人群报告的冠状动脉钙化评分与美国人群进行比较,因为这些是文献中可用的模式。

     

4 - 如果发现差异,应该进行一项关于我们人群中冠状动脉钙化值的前瞻性研究。

     

5 - 我们的研究是一个起点。

PT

  

1 - Uma vez identificadososindivíduosobobrisco elevado de eventos,propomos que estes sejam tratados conforme as diretrizes atuaisdereventionção,principalmente,no que se refere ao uso de estatinaseácidoacetilsalicílico2。

     

2 - Para seguimento de nosso trabalho,tornam-seadmandáriostimpisionaçõesmmulheres,númeromaiorde homens em idadesmaisavançadasede classes sociais diferentesdapopulaçãososudada(indivíduosdeclassemédia),comparaçãodosescoresdecálciocoronarianodescritos em populaçõesbrasileirasaos dos EUA,jáquesesssãosoposrõesdisponíveisnaliteratura。

     

3 - Casohajadiferenças,seria importante um estudo prospectivo do valordacalcificaçãoarterialcoronariana emnossapopulação。

     

4 - Nossoestudoéumimíciodaraesse processo。

提前致谢!

0 个答案:

没有答案