标签: performance unix join text
我们有2个文本文件(|分隔),并带有一个公共列来绑定它们。一个文本文件的大小接近45G(约1.25亿行),另一个文本文件小于7GB。
|
我们尝试在Linux中使用join命令。表演对我来说似乎很棒(花了大约90分钟来完成合并)。我想找到是否有任何其他工具/数据结构可以加快合并速度。虽然join命令非常快,但我们必须运行这个过程(即合并2个文件)70次。显然这可以达到100小时的处理时间。
join