我有一些中文和日文的数据,我希望可以通过它们的罗马化进行搜索(拼音代表中文,罗马字代表日语)。假定已经提供了罗马化,并用音节分隔。
例如文本"示例文本"
,它会浪漫化为["shi", "li", "wen", "ben"]
。
用户应该能够通过键入来匹配
shi li wen ben
或shiliwenben
shlwb
或slwb
wenben
或wb
(这些示例对应于上面文本的最后两个音节)。是否有一种优雅的实现方式?
(注意:我没有在此问题中指定任何编程语言,因为我想用其他语言来实现。如果您的回答是特定于语言或需要特定的库,请说明清楚。谢谢!)>