我使用的是Hadoop 2.5 Vanilla版本,我需要将大量数据集存储到HDFS和Hive中,但我不知道该怎么办?
任何人都可以帮忙修复此问题
提前谢谢
答案 0 :(得分:0)
要将文件存储到HDFS很简单,请参阅put文档:
Usage: hdfs dfs -put <localsrc> ... <dst>
您可以编写脚本来放置图像文件。
还有另一个问题告诉您如何使用Hive执行此操作:How to Store Binary Data in Hive?
我在网上看到一些讨论建议将图像存储到hdfs并存储元数据并链接到HBase中的文件比将图像直接存储到HBase更好。
请参阅以下链接以供参考:
http://apache-hbase.679495.n3.nabble.com/Storing-images-in-Hbase-td4036184.html http://www.quora.com/Is-HBase-appropriate-for-indexed-blob-storage-in-HDFS https://www.linkedin.com/groups/What-is-best-NoSQL-DB-3638279.S.5866843079608131586