我是新手。我有一个3节点集群。名称节点,作业跟踪器和辅助名称节点在一个节点中运行,另外两个数据节点中的两个数据节点(HData1,HData2)运行。如果我将本地系统中的数据存储到HDFS,如何查找它所在的节点?有没有办法可以明确指定它必须存储在哪个数据节点?
提前致谢!
答案 0 :(得分:1)
how does hdfs choose a datanode to store
How to explicilty define datanodes to store a particular given file in HDFS?