我有一个非常大的gzip csv文件(大约500GB),我需要使用批量加载工具在数据存储区中导入。是否有可能不必先解压缩?如果是,我如何配置bulkload.yaml文件?
transformers:
- kind: Client
connector: csv
connector_options:
encoding: zip?
答案 0 :(得分:1)
如何使用命名管道。
mkfifo --mode=0666 /tmp/namedPipe
gzip --stdout -d file.gz > /tmp/namedPipe
然后在另一个终端中或者如果你用&
分离了gzip命令appcfg.py upload_data --config_file=bulkloader.yaml --filename=/tmp/namedPipe --kind=YOUR_DATA_KIND
的示例