在mysql中存储dna序列数据的建议

时间:2019-06-26 01:44:54

标签: mysql configuration dna-sequence

我正在创建一个数据库来存储DNA序列数据,这些数据是这样的字符串:'atcgatcgatcg',而蛋白质序列数据也是这样的字符串:'MKLPKRML'。

我是MySQL管理的初学者,我想请您就数据类型,字符集和排序规则方面对这些列进行适当的配置。将有大约一百万个DNA和蛋白质序列行,我想使用字符串比较来提高性能。

我已经读到了这个问题,我有这些结论和疑问

  1. 我可以使用VARCHAR(MAX),因为我的字符串长度不会超过65,535个字符。

  2. BOLD字段的比较更快。在这种情况下比VARCHAR好吗?我也在考虑与数据检索相关的问题,因为检索必须是字符串类型,而不是字节

  3. 使用latin-1而不是utf-8更好?我只存储没有特殊字符的字母

谢谢您的帮助!

0 个答案:

没有答案