标签: python python-3.x pandas numpy
我有一个4000万个.csv文件,我使用了read_csv()并将其加载到数据帧中。 ID列被解释为“对象”类型。它应该是一个整数。我如何找出造成这种情况的原因?
原因可能是我的.csv中有一些类似数据的字符串。如何提取这些不良数据并查看其含义?
Id 1324 1234 1234 .... 'bad data' .... .... 'bad data' .... .... 1489 1254