有经验的Pandas用户使用Dataframe数据的问题。
我们总是希望使用Pandas来探索数据元素之间的关系。有时我们使用groupby类型函数来获取数据子集的汇总级数据。有时我们使用图表和图表来比较一列数据与另一列数据。我确定还有其他应用我没有想过。
当我和其他像我一样相当新手的用户交谈时,他们通常会尝试提取一些"大"数据帧为较小的dfs,可以正确排序或格式化以运行应用程序或绘图。这种方法当然有一个缺点,如果你将一个数据子集去掉一个较小的df,然后想要对你在更大的df中留下的一列数据进行分析,你必须返回并重新编写内容。
我的问题是 - 对于更有经验的用户来说,留下大型数据框并尝试以语法形式提取数据,以使效果与删除较小的df相同或相似,是最佳做法吗?或者最好切实使用较小的dfs来处理?
提前致谢。