为什么在构建多维数据集时日志总是显示“无可用数据”?

时间:2019-04-28 12:42:39

标签: cube kylin

sample官方网站上的Kylin案例中,当我构建cube时,在Create Intermediate Flat Hive Table的第一步中,日志始终为{{1 }},状态始终为No Data Available

多维数据集构建已执行了三个多小时。

我检查了配置单元数据库表running,并且该表中有数据。

我发现中间平面配置单元表kylin_sales已成功在配置单元中创建,但是其中没有数据。

kylin_intermediate_kylin_sales_cube_402e3eaa_dfb2_7e3e_04f3_07248c04c10c

部署环境如下:

  1. zookeeper-3.4.14
  2. hadoop-3.2.0
  3. hbase-1.4.9
  4. apache-hive-2.3.4-bin
  5. apache-kylin-2.6.1-bin-hbase1x
  6. openssh5.3
  7. jdk1.8.0_144

我通过docker部署了集群,并创建了3个容器,一个主容器,两个从属容器。

hive> show tables; OK ... kylin_intermediate_kylin_sales_cube_402e3eaa_dfb2_7e3e_04f3_07248c04c10c kylin_sales ... Time taken: 9.816 seconds, Fetched: 10000 row(s) hive> select * from kylin_sales; OK ... 8992 2012-04-17 ABIN 15687 0 13 95.5336 17 10000975 10000507 ADMIN Shanghai 8993 2013-02-02 FP-non GTC 67698 0 13 85.7528 6 10000856 10004882 MODELER Hongkong ... Time taken: 3.759 seconds, Fetched: 10000 row(s) 步骤正在运行。

1 个答案:

答案 0 :(得分:0)

No Data Available表示Kylin尚未捕获此步骤的日志。通常只有在退出步骤(成功或失败)时,才会记录日志,然后您才能看到数据。

在这种情况下,通常由于多种原因,它表明该作业正在由Hive挂起。最简单的方法是,观看Kylin的日志,您将看到Kylin执行的Hive CMD,然后可以在控制台中手动运行它,然后重现该问题。请检查您的Hive / Hadoop是否具有足够的资源(cpu,内存)来执行此类查询。