我在网上浏览了计算要翻译的文档中重复次数的标准公式。我还没找到。对于那些不知道翻译中的重复意味着什么的人,this给出了很好的描述。
我第一次尝试这样的事情
using System;
using System.Collection.Generic;
using System.Text.RegularExpressions;
using System.Linq;
<snip>
Dictionary<string, int> _dict = new Dictionary<string, int>();
int CalculateRepetitions(string plainTextDoc) {
foreach (string item in Regex.Split(plainTextDoc, "\\P{L}+"))
if (_dict.ContainsKey(item))
_dict[item]++;
else
_dict.Add(item, 0);
return _dict.Where((key, value) => value > 0).Count();
}
但是这与同一文件中Trados的样本编号并不相符,无论如何都是错误的重复定义。有没有人有一个计算翻译重复的好例子?我不期待只有C#的答案,我对java和c ++的答案也很好。