标签: hadoop
我需要从具有现有数据的多个服务器构建分布式故障证明(尽可能)集群。 我是Hadoop的新手,但就我所知,它比其他产品更接近满足我的要求。 问题是我已经有一些数据(非常大的文件),我希望在Hadoop中可用。 是否可以将具有现有数据的服务器作为DataNode添加到Hadoop? 我该怎么做才能成功呢?
答案 0 :(得分:0)
似乎不可能,除了在该框上部署DataNode后将现有数据移动到HDFS