比较两个较大的CSV文件,并根据不同之处制作出第三个文件

时间:2018-11-09 15:32:06

标签: scala scala-collections

我有一个问题,我需要比较两个大型CSV文件(大约5至8 GB),并且必须从它们的区别中制作出第三个CSV文件。 支持的库的任何建议指针,用于相同或任何参考的入门

例如

File 1.csv

+---+------+------+
|ID |value1|value2|
+---+------+------+
|  1|    a|   Ran1|
|  2|    b|   Ran2|
+---+-----+-------+

File 2.csv

+---+------+------+
|ID |value1|value2|
+---+------+------+
|  3|    c|   Ran3|
|  2|    b|   Ran2|
+---+-----+-------+

Schema of both file is same

Result - file 3.csv
File 2.csv

+---+------+------+
|ID |value1|value2|
+---+------+------+
|  2|    b|   Ran2|
+---+-----+-------+

0 个答案:

没有答案