为什么在Hadoop中使用名为HDFS的特定文件系统? HDFS相对于NTFS或FAT有什么优势? 为hadoop选择HDFS的原因是什么?
答案 0 :(得分:2)
...因为NTFS和FAT不是分布式的。 HDFS的优点在于它。
答案 1 :(得分:0)
我想知道HDFS是否
a)文件系统的直接替代品,如ntfs和ext4("我是否必须格式化硬盘以设置HDFS节点并且将丢失所有现有数据?")
b)安装在底层文件系统之上。
在搜索答案时发现了这个问题。
嗯,这是b)
HDFS不是一个实际的文件系统,但它使用API访问 底层filesystem.Yahoo使用ext3作为hadoop的基本文件系统 部署。
相关问题和文章:
How are HDFS files getting stored on underlying OS filesystem?
https://wiki.apache.org/hadoop/DiskSetup#Underlying_File_System_Options
https://www.quora.com/Does-HDFS-replace-local-file-systems-FAT32-NTFS-etc-or-operate-on-top-of-them
https://community.hortonworks.com/articles/14508/best-practices-linux-file-systems-for-hdfs.html
https://askubuntu.com/questions/359481/where-in-linux-file-system-can-i-see-files-of-hadoop-hdfs
How Cassandra file system interacts with platform file system