我的实验室正在进行大量的测序,但是记录序列的方式使得难以检索它们或跟踪数据。我想创建一个具有以下功能的数据库:
- 一个图形用户界面,允许用户上传/检索/查看数据,并可以包含链接以快速BLAST或使用其他在线工具分析序列。
- 允许一个人在命令行中访问它
- GUI上还有另一个部分,其中包含实验室中的内容,需要订购的内容等。
我想知道是否有可以采用和修改的通用数据库模板以满足我的实验室需求?我没有数据库设计的经验,但已阅读有关mySQL的内容。
在开始这个项目时我应该采取的第一步是什么?
谢谢!
答案 0 :(得分:1)
这是一个有趣的问题和问题领域(我现在用btw表示)。您的第一步是确定一般架构,然后为此选择技术。
对于Web /图形方面,有很多现成的组件(我假设你知道像AntiSMASH,JBrowse等工具)。但是你需要评估这些。然而,这超出了db方面的范围。
在数据库方面,PostgreSQL在这里表现令人钦佩。我曾经研究过一个负载很重的10 + TB数据库,它专门存储测序数据,BLAST报告等等。如果你在其上添加像PostBIS这样的东西,你会得到一些非常实用的功能。
然而,该行业中许多较重的部分都在使用Hadoop,因为可用数据量的增长速度非常快,但实现这项工作所需的专业知识量也相应更高。