从合并的csv文件

时间:2017-12-27 20:46:21

标签: python-3.x pandas mergesort pandas-groupby

我正在学习数据科学训练营,目前正在考虑在pandas / jupyter笔记本中合并和排序csv文件,以便创建新的数据帧。我一直遇到的一个问题是,当我尝试将两个非数字对象(例如“城市”,“城市类型” - 城市,郊区,乡村等)分组时,我要么出错,要么被迫创建一个数组。在之前的练习中,数组不是问题,因为我可以解决它们。在这个特定的实例中,我绝对需要使用数组中包含的数据作为散点图。我已经问过教授们如何解决这个问题(但只是得到了b / c它的家庭作业的谨慎回应),经历了无数的饲料,并回顾了我们之前的所有课程,但似乎无法弄明白。那么,有没有办法在pandas中分组两个非数字列而不创建数组?我是新人,一下子被大量的材料击中,感觉我错过了一些基本的东西。非常感谢任何指导。

1 个答案:

答案 0 :(得分:0)

从上面评论的屏幕截图中,我看到您的<input type="date" id="date"> <button onclick="calculateYear()">calculate</button> <br> <p id="result"></p>来电正在为每个城市生成一个成员列表,而不是仅仅为您提供每种城市类型的字符串表示。

如果您可以安全地假设每个城市都有一种且只有一种类型,那么您最好的选择是将pyber_df.groupby("City")["Type"].unique()替换为unique

first