C#使用XSAMPA获取单词的音素拼写

时间:2012-10-28 12:55:26

标签: dll resources speech phonetics

我正在网上搜索资源和方法,但我可以找到任何链接。

我能找到的唯一可以执行此操作的地方是THIS LINK,您可以输入一个单词,它会在 SAMPA 中为您提供该单词的音素拼写。

This guy xsampa 的行中发布了一些内容,但是没有给出关于如何获得这些课程的任何线索等等。你知道这在C#中是否可行吗? ,我在哪里可以找到关于此的资源?

您的翻译应该如何与JULIUS合作。

示例:

abatement   @ b @i t m @ n t    1   0
abates  @ b @i t s  1   0
abating @ b @i t i N    1   0
abattoir    { b @ t w A: r\ 1   0
abattoirs   { b @ t w A: z  1   0
abbess  { b E s 1   0
abbesses    { b E s @ s 1   0
abbey   { b i   1   0
abbeys  { b i z 1   0
abbot   { b @ t 1   0
abbots  { b @ t s   1   0
abbreviate  @ b r\ i: v i @i t  1   0
abbreviated @ b r\ i: v i @i t @ d  1   0
abbreviates @ b r\ i: v i @i t s    1   0
abbreviating    @ b r\ i: v i @i t i N  1   0
abbreviation    @ b r\ i: v i @i S @ n  1   0
abbreviations   @ b r\ i: v i @i S @ n z    1   0
abdicate    { b d i k @i t  1   0
abdicated   { b d i k @i t @ d  1   0
abdicates   { b d i k @i t s    1   0

如果首先将其转换为Sampa然后将单词替换为与Juluis兼容的X-sampa,或者直接使用某些映射将其转换为X-Sampa

1 个答案:

答案 0 :(得分:2)

听起来你需要一本英语发音词典。一个常用的是CMU Pronouncing DictionaryWikipedia),它列出了133746个单词的发音。它是免费提供的(公共领域)作为纯文本文件。

它使用its own weird phonetic transcription,但如果您不关心词汇压力,用X-SAMPA等效替换每个音素并不困难。例如:

  

堆栈溢出
  S T AE K . OW V ER F L OW2 .

可以转换为X-SAMPA

  

/st{k Owvr=flOw/

为每个音素使用查找表。

字典不包含所有英文单词,但there is also a tool to guess the pronunciation of words not in the dictionary