我正在构建一个需要国家/地区列表的Rails应用程序。城市应至少包含100,000人。我找到了来自Wikipedia的数据。但我需要澄清城市名称包含一些特殊字母。
Durrës - ë
Vicente López - ó
São Paulo - ã
我用Google搜索,发现这些是重音音节。
我的问题是
Can I directly insert these values into the database?
Can I search the database without any problem?
谢谢。
答案 0 :(得分:1)
如果您将数据库设置为存储值为utf-8,那么您应该可以毫无问题地存储各种这样的值。
在排序和比较时,重要的是你要求数据库使用哪种排序规则。简而言之,整理是一组规则,说明如何比较字符串,例如,如何相对于e进行排序,ß等于ss等等。
当使用全文搜索(solr,sphinx等)时,你应该确保你的停用词,词干分析器的选择等都是Unicode识别的