标签: dataset nlp corpus
我知道这是一个很长的镜头,但有没有人知道英语单词的数据集有音节压力信息?像下面这样简单的东西会非常棒:
AARD vark A ble a BOUT ac COUNT AC id ad DIC tion ad VERT ise ment ...
答案 0 :(得分:13)
我最接近的是CMU Pronouncing Dictionary。我不认为它明确标志着重读的音节,但它应该是一个开始。