您可以将哪种类型的数据放入HDFS

时间:2014-07-03 12:16:30

标签: hadoop hdfs

我刚刚安装完Hadoop。我正在从互联网数据样本下载。

我可以将哪些类型的数据放入HDFS?例如,我可以放Excel表吗?

谢谢

3 个答案:

答案 0 :(得分:2)

您可以在HDFS上放置任何类型的数据(包括Excel工作表)。但是,您可能无法阅读它们。

例如,除非在Excel上存在HDFS连接器,否则您将无法在群集上打开文件,并且必须将它们复制回您的计算机上。

如果要从Excel工作表中读取数据,最简单的方法是将每个工作表导出为csv,并通过配置单元在HDFS上读取它们,因为有多个与Excel兼容的ODBC驱动程序(请参阅this example )。

答案 1 :(得分:0)

不确定您正在运行的是什么版本的hadoop,但您可以从hortonworks尝试此操作

http://hortonworks.com/hadoop-tutorial/how-to-use-excel-2013-to-access-hadoop-data/

答案 2 :(得分:0)

HDFS可以存储结构化数据,半结构化和非结构化数据。

每种类型的例子:

- 结构化数据:数据库表,企业系统数据(ERP,CRM等)

- 半结构化数据:日志,xml文件

- 非结构化数据:图片,视频,文字文档,pdf文件,文本文件。