Hive教程的示例数据

时间:2016-11-22 09:01:07

标签: hive dataset

在线提供的原始Hive教程是指一个名为" pv_2008-06-08.txt"的数据集:

https://cwiki.apache.org/confluence/display/Hive/Tutorial

当然,它在互联网上的几十个教程中被引用。但是,我无法在任何地方找到原始数据。有没有人知道它在哪里?

1 个答案:

答案 0 :(得分:1)

在阅读给定网站后,发现该网站提供的示例已过时。请使用新链接获取更多示例。

https://cwiki.apache.org/confluence/display/Hive/Tutorial#Tutorial-UsageandExamples

注意:以下许多示例都已过期。可以在LanguageManual中找到更多最新信息。

如果您仍对该数据集感兴趣,建议您邮寄给社区提供(请参阅以下链接)

http://hive.apache.org/mailing_lists.html

Hortonworks数据集:

最近我遇到了这个Hortonworks数据集,可用于在Hive和Pig中创建数据库和查询。

https://app.box.com/v/hadoopcrashcoursedata

如果您想尝试使用此数据集,以下是使用上述数据集

创建表格的链接

http://hortonworks.com/hadoop-tutorial/hello-world-an-introduction-to-hadoop-hcatalog-hive-and-pig/#section_4