Question

我身上发生了非常奇怪的事情。我保存了一个具有100,000行的数据框文件，但是加载的行大小不同。该逻辑已在Windows中进行了测试，并且可以在osx上正常运行。

我想知道是否有人和我有同样的问题，或者我错过了什么。

代码如下：

dataframe.to_csv('./aa.csv', index=False)
print(dataframe.shape)
df = pd.read_csv('./aa.csv')
print(df.shape)

和结果

(100000, 128)
(167469, 128)

我使用随机数据帧进行了测试

df = pd.DataFrame(pd.np.random.randint(0,100,size=(100000, 128)))

然后测试结果符合我的预期

(100000, 128)
(100000, 128)

所以我认为我的数据可能有问题，但是我不知道从哪里开始。我想知道，如果在某种条件下数据帧出现这种问题。

已添加：我发现了另外一个。

print(dataframe.ORD_NO[0])
0    22424855
0    22019413
0    21988486
0    22026683
0    22385278
0    21999297
0    22006981
0    22041489
0    22529317
0    22340157
Name: ORD_NO, dtype: object

print(df.ORD_NO[0])
22424855.0

似乎数据帧索引无法正常工作。我希望这种检测有助于解释。

数据框保存和加载的行大小在OSX中不同

0 个答案: