Question

我一直在尝试使用python笔记本中的read.csv导入我的数据集。但是，在导入我的数据集时，我看到每列的数据类型都变为对象。 Plz click this image to see the issue

有没有办法可以保留与csv文件相同的列的数据类型？

我尝试过多种其他方式，但没有锻炼。如果有人指出我们有一些正确的功能来做这件事会有所帮助。如果有一种方法可以在导入时控制每列的数据类型，那将是很好的。

Answer 1

当您的数据类型不一致时会发生这种情况，例如：整数和字符，如空格。如果没有查看实际数据的样本很难说，但我怀疑这是问题所在。例如，

>>> pd.DataFrame([1, 2, '']).info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 3 entries, 0 to 2
Data columns (total 1 columns):
0    3 non-null object
dtypes: object(1)
memory usage: 48.0+ bytes

要解决此问题，您需要替换这些值，例如＆＃34;＆＃34;具有诸如-1的有感知值（实际值取决于您的用例）。

数据类型中的问题，而csv文件作为熊猫数据帧

1 个答案: