标签: database random-sample
我正在使用一个大型的postgres数据库。
我想在生成数据库中使用生产数据样本作为测试数据。
但是,如果我转储生产数据,并随机删除90%的数据,我变得非常稀疏。也就是说,表格中的数据不再像过去那样相关。
在保持数据相关的同时,可以应用哪些技术来对数据库进行采样?