每次我导入这个csv('leads.csv')我都会收到以下错误:
/usr/local/lib/python2.7/site-packages/pandas/io/parsers.py:1130: DtypeWarning: Columns (11,12,13,14,17,19,20,21) have mixed types. Specify dtype option on import or set low_memory=False.
data = self._reader.read(nrows)
我为这一个分析输入了许多.csv,其中'leads.csv'只有一个。这是唯一有问题的文件。当我在电子表格应用程序中查看这些列时,值都是一致的。
例如,第11列(使用Excel时为K列)是一个简单的布尔字段,实际上,每一行都会被填充,并且它始终以“FALSE”或“TRUE”完全填充。此错误消息引用的其他字段具有一致格式化的字符串值,仅包含字母和数字。在大多数这些列中,至少有一些空白。
无论如何,鉴于所有这些,我不明白为什么这个消息不断发生。这似乎并不重要,因为我无论如何都可以使用数据。但这是我的问题:
1)您如何识别导致此错误的任何行/记录?
2)在我阅读的许多帖子中,使用low_memory = False选项似乎非常不受欢迎。在这种情况下,我是否需要声明每个字段的数据类型?或者我应该忽略错误?