我正在寻找一种基于字符的n-gram语言模型,例如:
给出键入的文本:
Instruments
输出每个字符的概率:
List<string>
List<string> results = new List<string>();
Instruments.ForEach(w => {
foreach (char v in vowels) {
results.Add(w.Replace(v, ' '));
}
});
results.ForEach(w => Console.WriteLine(w));
我找到的所有LM都输出了单词或字符预测,但没有基于字符的概率。我可以使用任何库/工具箱或代码吗?理想情况下,使用C#或.NET,但如果使用C / C ++或Python,我也可以构建包装器。