我正在使用火花解释器处理齐柏林飞艇笔记本电脑,我希望得到一个散点图,但我想让这些点具有3种不同的颜色。
我在zeppelin中集成了matplotlib,因为很容易在同一张图中绘制不同的熊猫数据框。
import matplotlib.pyplot as plt
from matplotlib.pyplot import figure
# get object from ResourcePool
MemArb=sqlContext.table("MemArb")
VoisArb=sqlContext.table("VoisArb")
SousTest=sqlContext.table("SousTest")
MemArb=MemArb.toPandas()
VoisArb=VoisArb.toPandas()
SousTest=SousTest.toPandas()
x_client = SousTest["derx"].
astype('float').iloc[0]
y_client = SousTest["dtrx"].
astype('float').iloc[0]
x_memeArbre = MemArb['valx'].astype('float')
y_memeArbre = MemArb['valOx'].astype('float')
x_voisinArbre = VoisArb['vax'].astype('float')
y_voisinArbre = VoisArb['valOx'].astype('float')
y_voisinArbre.count()
figure(num=None, figsize=(10, 8), dpi=80, facecolor='w', edgecolor='k')
plt.scatter(x_client, y_client, s=90, color='b')
plt.scatter(x_memeArbre,y_memeArbre,s=10, color='r')
plt.scatter(x_voisinArbre, y_voisinArbre, s=10, color='b')
plt.title('Nuage de points avec Matplotlib')
plt.xlabel('ONx')
plt.ylabel('OLx')
plt.show()
有没有使用matplotlib的齐柏林飞艇获得相同结果的解决方案
答案 0 :(得分:0)
您可以在数据框上使用createOrReplaceTempView
函数,然后编写SQL查询以获取数据。当前的Zeppelin(0.8.0)在所提供的内置可视化效果中具有散点图。只需确保每个数据点都有对应的指示颜色的列即可。