使用Java分割日语文本的最佳方法是什么? 例如,对于以下文本:
こんにちは。私の名前はオバマです。私はアメリカに行く。
我需要以下输出:
こんにちは
私の名前はオバマです
私はアメリカに行く
可以使用Kuromoji吗?
答案 0 :(得分:4)
您可以使用java.text.BreakIterator。
こんにちは。
私の名前はオバマです。
私はアメリカに行く。
该程序的输出为:
def ATTR(key, value):
return {key: value}
您不能使用Kuromoji查找日语句子边界。它可以将句子分解为单词。