如何对汉语拼音和日语罗马字进行模糊搜索?

时间:2019-04-09 13:09:12

标签: fuzzy-search cjk

我有一些中文和日文的数据,我希望可以通过它们的罗马化进行搜索(拼音代表中文,罗马字代表日语)。假定已经提供了罗马化,并用音节分隔。

例如文本"示例文本",它会浪漫化为["shi", "li", "wen", "ben"]

用户应该能够通过键入来匹配

  • 整个音节,有或没有空格,例如shi li wen benshiliwenben
  • 首字母缩写或音节的前几个字母,例如shlwbslwb
  • 它们也可能只键入字符串的一部分,例如。 wenbenwb(这些示例对应于上面文本的最后两个音节)。

是否有一种优雅的实现方式?

(注意:我没有在此问题中指定任何编程语言,因为我想用其他语言来实现。如果您的回答是特定于语言或需要特定的库,请说明清楚。谢谢!)

0 个答案:

没有答案