我在使用Zeppelin创建可视化时遇到问题。我有一个包含大约6亿条记录的数据集。它存储在HDFS集群中,我可以加载为Spark数据帧:
%spark.pyspark
input_hdfs_path = u'hdfs://cluster-master:9000/data/CDR_*.parquet'
df = spark.read.format('parquet').load(input_hdfs_path)
df.registerTempTable("df")
我有兴趣在CDR的长度上创建直方图(字段CDR_LENGTH
):
%sql
select ROUND(CDR_LENGTH, -2) as duration, count(*) as count
from df
group by 1
order by 1
我确实在“表格”标签中显示了相应的结果(包含两列,duration
和count
),但在转到条形图标签(或任何其他图形标签)时,它只是说“没有可用数据”。你能弄清楚我做错了什么吗?感谢
答案 0 :(得分:5)
您可以在图表按钮的右侧找到class SomeListController: BaseTableVC<DogCell, Dog> {
override func viewDidLoad() {
super.viewDidLoad()
items = [Dog(name: "Cho 1"), Dog(name: "Cho 2")]
}
}
,
然后根据需要定义settings
,Keys
,Groups
。