运行curl命令以通过python / jython将数据加载到hdfs

时间:2019-07-28 16:53:27

标签: curl jython-2.7 streamsets

当我们执行jython / python时,如果URL包含空格,则无法将文件下载到hdfs 例如: URL在文件名和目录路径中包含空格

> http://www.example.com/a bc/def/c h.csv

我通过用%20或+符号转义空格来尝试使用url的命令均无效。

通过如下所示在python中打开外壳来执行以下命令。如果该网址不包含空格,则表示该网址正确无误。

curl http://www.example.com/a bc/def/c h.csv | hadoop fs -put -f - /xyz/c h.csv

1 个答案:

答案 0 :(得分:1)

如何用反斜杠转义空格?还是用引号将网址引起来?试试:

http://www.example.com/a\ bc/def/c\ h.csv"http://www.example.com/a bc/def/c h.csv"