以下单元测试失败:
displaysLatvianLocale
org.junit.ComparisonFailure: expected:<[Krievu]> but was:<[Russian]>
org.junit.ComparisonFailure: expected:<[Angļu]> but was:<[English]>
没问题。但其他两项测试失败了:
ru
JRE没有en
和Locale.getDisplayName()
的拉脱维亚语翻译,可以使用英语。
是否可以将用户定义的翻译添加到>>> from nltk import word_tokenize
>>> text1 = 'martina hingis, nadia petrova, agnieszka radwa?ska'
>>> text2 = 'agnieszka radwa?ska'
>>> word_tokenize(text1)
['martina', 'hingis', ',', 'nadia', 'petrova', ',', 'agnieszka', 'radwa', '?', 'ska']
>>> word_tokenize(text2)
['agnieszka', 'radwa', '?', 'ska']
?