如何存储/ * url *的实际名称?

时间:2011-03-28 19:59:00

标签: bash unix hadoop hdfs

我正在将脚本转换为HDFS(Hadoop),我有这个cmd:

    tail -n+$indexedPlus1 $seedsDir/*url* | head -n$it_size > $it_seedsDir/urls

使用HDFS我需要使用-get获取文件,这样可以。

bin/hadoop dfs -get $seedsDir/*url* .

但是我不知道下载的文件名是什么,更不用说我想存储在$ local_seedsDir / url 中。 我可以知道吗?

KISS告诉我:

bin/hadoop dfs -get $seedsDir/*url* $local_seedsDir/urls

即。只需将文件命名为本地URL即可。

1 个答案:

答案 0 :(得分:0)

url=`echo bin/hadoop dfs -get urls-input/MR6/*url* .`

然后tail和head从url中提取实际文件名并将其存储在$ urls

rm $urls

但除此之外,只是KISS