我已经在这方面工作了几天而没有像我想的那样取得进展。我知道富兰克林M.梁的连字算法在许多languages中实现。然而,这些都不是R.
即使在R中有一个实现,我也不确定它是否会完全符合我的要求,因为我有兴趣识别音节,而不仅仅是在声学和视觉上吸引人的位置进行换行。
我理想的实施方式如下:
w = c('country', 'someone', 'merely')
syllables(w)
[1] "coun-try" "some-one" "mere-ly"
答案 0 :(得分:2)
Liang的连字算法在koRpus包中实现。小插图指出
“函数hyphen()接受类kRp.tagged的对象,并对每个单词应用连字算法(Liang,1983)。”