如何确定数据框是Pandas还是Spark?

时间:2019-05-14 08:57:08

标签: pandas apache-spark dataframe

我将数据框传递给函数。有时是Pandas数据框,有时是Spark数据框。我的职能需要采取相应的行动。是否有一种简单的方法(例如df.isPandas())来确定数据帧(接收为“ df”)是Pandas数据帧还是Spark数据帧?预先感谢。

2 个答案:

答案 0 :(得分:3)

使用isinstance

if isinstance(df, pd.DataFrame):
    print('pandas')
else:
    print('spark')

答案 1 :(得分:0)

另一种方法是检查df.schema.names。这仅在Spark上。实际上,还有许多其他差异,例如.show()。可能是一个很好的面试问题:)