是否有一种文化敏感的方法来识别字符串中的句子?
或者在.NET框架(或其他地方)中有什么东西可以提供特定于文化的句子终结符
例如,英语使用时说“。”,“!”,“?” (和其他人)标记句子的结尾,中文使用。泰语使用空格。
答案 0 :(得分:4)
我无法看到内置于框架中的内容。您可以做的一件事是创建一系列解析器并根据CultureInfo.CurrentCulture选择正确的解析器。也就是说,有一个解析器实现一个名为ISentenceParser的新接口,并创建一组实现,每个实现根据特定语言处理句子解析。然后,当你需要解析时,你会得到你所需要的语言。
但更好的问题是,为什么这是必要的?我可以想到很少有你想要解析成句子的情况(虽然我可能只是没有足够的创造力:))。
答案 1 :(得分:-1)
我认为点网中没有句子结尾这样的东西。所以你必须使用自己的实现。你想做什么?