我在HDFS中存储了一个大文件,在最后一列中有一个机器地址,我想将每一行发送到ap地址并将其存储在文本文件中(在本地文件系统上而不是HDFS上)可以吗我找不到在spark或hadoop中执行此操作的方法。
输入文件示例:
attr1 attr2 ..attrN 192.168.40.5
attr1 attr2 ..attrN 192.168.40.19
答案 0 :(得分:0)
我找不到使用hadoop或spark的方法,因为您无法告诉那些框架将数据发送到哪里,但是我找到了一种获取所需结果的方法,步骤如下所示:
hadoop fs -copyToLocal
,并为每台计算机提供适当的参数