我正在创建一个数据库来存储DNA序列数据,这些数据是这样的字符串:'atcgatcgatcg',而蛋白质序列数据也是这样的字符串:'MKLPKRML'。
我是MySQL管理的初学者,我想请您就数据类型,字符集和排序规则方面对这些列进行适当的配置。将有大约一百万个DNA和蛋白质序列行,我想使用字符串比较来提高性能。
我已经读到了这个问题,我有这些结论和疑问
我可以使用VARCHAR(MAX),因为我的字符串长度不会超过65,535个字符。
BOLD字段的比较更快。在这种情况下比VARCHAR好吗?我也在考虑与数据检索相关的问题,因为检索必须是字符串类型,而不是字节
使用latin-1而不是utf-8更好?我只存储没有特殊字符的字母
谢谢您的帮助!