我正在尝试运行此删除,但我认为它不会完成。任何有关如何提高性能的建议都将受到赞赏。 THX
delete CCLE.table1
from CCLE.table1
join CCLE.table1 table2
on CCLE.table1.cor_estimate = table2.cor_estimate
and CCLE.table1.g1_gene_symbol = table2.g2_gene_symbol
and CCLE.table1.g2_gene_symbol = table2.g1_gene_symbol
and CCLE.table1.g1_ncbi_gene_id < CCLE.table1.g2_ncbi_gene_id;
答案 0 :(得分:1)
综合指数:
INDEX(cor_estimate, g1_gene_symbol, g2_gene_symbol, g1_ncbi_gene_id)
即使这样也可能不会加快速度和#34;然后,我会考虑在&#34; chunks&#34;中进行,也许正如所讨论的那样here。
您可以考虑在存储它们之前对两个gene_symbol进行排序(通过LEAST()
和GREATEST()
)。这样,它们处于规范顺序,也许可以避免查询。