我将数据框传递给函数。有时是Pandas数据框,有时是Spark数据框。我的职能需要采取相应的行动。是否有一种简单的方法(例如df.isPandas())来确定数据帧(接收为“ df”)是Pandas数据帧还是Spark数据帧?预先感谢。
答案 0 :(得分:3)
使用isinstance
:
if isinstance(df, pd.DataFrame):
print('pandas')
else:
print('spark')
答案 1 :(得分:0)
另一种方法是检查df.schema.names
。这仅在Spark上。实际上,还有许多其他差异,例如.show()
。可能是一个很好的面试问题:)