我一直在尝试使用python笔记本中的read.csv导入我的数据集。 但是,在导入我的数据集时,我看到每列的数据类型都变为对象。 Plz click this image to see the issue
有没有办法可以保留与csv文件相同的列的数据类型?
我尝试过多种其他方式,但没有锻炼。如果有人指出我们有一些正确的功能来做这件事会有所帮助。如果有一种方法可以在导入时控制每列的数据类型,那将是很好的。
答案 0 :(得分:1)
当您的数据类型不一致时会发生这种情况,例如:整数和字符,如空格。如果没有查看实际数据的样本很难说,但我怀疑这是问题所在。例如,
>>> pd.DataFrame([1, 2, '']).info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 3 entries, 0 to 2
Data columns (total 1 columns):
0 3 non-null object
dtypes: object(1)
memory usage: 48.0+ bytes
要解决此问题,您需要替换这些值,例如&#34;&#34;具有诸如-1的有感知值(实际值取决于您的用例)。