应用错误收集

如何对汉语拼音和日语罗马字进行模糊搜索？

时间：2019-04-09 13:09:12

标签： fuzzy-search cjk

我有一些中文和日文的数据，我希望可以通过它们的罗马化进行搜索（拼音代表中文，罗马字代表日语）。假定已经提供了罗马化，并用音节分隔。

例如文本"示例文本"，它会浪漫化为["shi", "li", "wen", "ben"]。

用户应该能够通过键入来匹配

整个音节，有或没有空格，例如shi li wen ben或shiliwenben
首字母缩写或音节的前几个字母，例如shlwb或slwb
它们也可能只键入字符串的一部分，例如。 wenben或wb（这些示例对应于上面文本的最后两个音节）。

是否有一种优雅的实现方式？

（注意：我没有在此问题中指定任何编程语言，因为我想用其他语言来实现。如果您的回答是特定于语言或需要特定的库，请说明清楚。谢谢！）

0 个答案:

没有答案