标签: apache-spark hadoop sqoop
我在Oracle和Sybase DB中有很多表,它也是大表。
表的pk(主键)是char和多列组合。
char
如何制作Sqoop脚本?我是否使用'--split by char or string'?
'--split by char or string'
我只知道分布不均匀的mapper和重复项。
我该怎么办?