我有以下数据:
23345355,USA, ,1/8/2016,5411, ,18.31, ,95448
268035111,USA, ,1/8/2016,5921, ,15.22, ,90266
35940332,USA, ,1/26/2016,5651, ,121.94, ,91306
4211391, , ,12/31/2015,0, ,44.40, ,
319878537,USA, ,12/29/2015,5814,04,0.86, ,90029
117039647,ESP, ,1/2/2016,3535, ,372.38, ,08019
246311053,USA, ,1/11/2016,7523, ,1.50, ,11101
953217,USA, ,1/29/2016,5968, ,29.70, ,95032
270542768,USA, ,1/17/2016,7832, ,18.30, ,40503
42855400, , ,1/6/2016,0, ,50.00, ,
190065824, , ,12/31/2015,0, ,120.00, ,
243492296,USA, ,1/25/2016,5331, ,6.89, ,40810
102483965,US , ,12/31/2015,5814, ,25.00, ,19341
我想查看最后一列,并做一个直方图,所以,我做了(df是熊猫df)
df = df[df[LAST_COLUMN].apply(lambda x: x.isnumeric())]
这样我就清理了不是数字的元素(我检查过并且工作过)。
但是,当我执行df.hist()时,我只获得第0,4和6列的直方图,而不是第8列(LAST_COLUMN)。看起来某些元素不是数字,但我检查了它们都是数字。
为什么?
答案 0 :(得分:1)
您最后一列不符合int
类型,因为08019
并非隐含地被视为int。针对该列调用astype(int)
以将其转换为int。