我正在将脚本转换为HDFS(Hadoop),我有这个cmd:
tail -n+$indexedPlus1 $seedsDir/*url* | head -n$it_size > $it_seedsDir/urls
使用HDFS我需要使用-get获取文件,这样可以。
bin/hadoop dfs -get $seedsDir/*url* .
但是我不知道下载的文件名是什么,更不用说我想存储在$ local_seedsDir / url 中。 我可以知道吗?
KISS告诉我:
bin/hadoop dfs -get $seedsDir/*url* $local_seedsDir/urls
即。只需将文件命名为本地URL即可。
答案 0 :(得分:0)
url=`echo bin/hadoop dfs -get urls-input/MR6/*url* .`
然后tail和head从url中提取实际文件名并将其存储在$ urls
中rm $urls
但除此之外,只是KISS