数据类型中的问题,而csv文件作为熊猫数据帧

时间:2016-07-21 00:32:43

标签: python csv pandas dataframe import

我一直在尝试使用python笔记本中的read.csv导入我的数据集。 但是,在导入我的数据集时,我看到每列的数据类型都变为对象。  Plz click this image to see the issue

有没有办法可以保留与csv文件相同的列的数据类型?

我尝试过多种其他方式,但没有锻炼。如果有人指出我们有一些正确的功能来做这件事会有所帮助。如果有一种方法可以在导入时控制每列的​​数据类型,那将是很好的。

1 个答案:

答案 0 :(得分:1)

当您的数据类型不一致时会发生这种情况,例如:整数和字符,如空格。如果没有查看实际数据的样本很难说,但我怀疑这是问题所在。例如,

>>> pd.DataFrame([1, 2, '']).info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 3 entries, 0 to 2
Data columns (total 1 columns):
0    3 non-null object
dtypes: object(1)
memory usage: 48.0+ bytes

要解决此问题,您需要替换这些值,例如&#34;&#34;具有诸如-1的有感知值(实际值取决于您的用例)。