我刚刚安装完Hadoop。我正在从互联网数据样本下载。
我可以将哪些类型的数据放入HDFS?例如,我可以放Excel表吗?
谢谢
答案 0 :(得分:2)
您可以在HDFS上放置任何类型的数据(包括Excel工作表)。但是,您可能无法阅读它们。
例如,除非在Excel上存在HDFS连接器,否则您将无法在群集上打开文件,并且必须将它们复制回您的计算机上。
如果要从Excel工作表中读取数据,最简单的方法是将每个工作表导出为csv,并通过配置单元在HDFS上读取它们,因为有多个与Excel兼容的ODBC驱动程序(请参阅this example )。
答案 1 :(得分:0)
不确定您正在运行的是什么版本的hadoop,但您可以从hortonworks尝试此操作
http://hortonworks.com/hadoop-tutorial/how-to-use-excel-2013-to-access-hadoop-data/
答案 2 :(得分:0)
HDFS可以存储结构化数据,半结构化和非结构化数据。
- 结构化数据:数据库表,企业系统数据(ERP,CRM等)
- 半结构化数据:日志,xml文件
- 非结构化数据:图片,视频,文字文档,pdf文件,文本文件。