如何分割日语文字?

时间:2018-09-03 08:31:23

标签: text stanford-nlp opennlp cjk kuromoji

使用Java分割日语文本的最佳方法是什么? 例如,对于以下文本:

こんにちは。私の名前はオバマです。私はアメリカに行く。

我需要以下输出:

こんにちは
私の名前はオバマです
私はアメリカに行く

可以使用Kuromoji吗?

1 个答案:

答案 0 :(得分:4)

您可以使用java.text.BreakIterator。

こんにちは。
私の名前はオバマです。
私はアメリカに行く。

该程序的输出为:

def ATTR(key, value):
    return {key: value}

您不能使用Kuromoji查找日语句子边界。它可以将句子分解为单词。