标签: mysql database
我有一个项目,我有很多基因组,每个都有几千个数据点。
在介绍新基因组时,我希望能够测试它是否与现有基因组重复。随着测试方法的进展,来自不同供应商的测试将会随着时间的推移而改变,因此直接校验和比较将不起作用。
我认为基于数据集对于他们所拥有的常见结果的不同程度进行统计比较,并设置一个条形可能会这样做和/或创建一个可以快速比较的缩小“指纹”。
任何建议都非常感谢。