我身上发生了非常奇怪的事情。我保存了一个具有100,000行的数据框文件,但是加载的行大小不同。该逻辑已在Windows中进行了测试,并且可以在osx上正常运行。
我想知道是否有人和我有同样的问题,或者我错过了什么。
代码如下:
dataframe.to_csv('./aa.csv', index=False)
print(dataframe.shape)
df = pd.read_csv('./aa.csv')
print(df.shape)
和结果
(100000, 128)
(167469, 128)
我使用随机数据帧进行了测试
df = pd.DataFrame(pd.np.random.randint(0,100,size=(100000, 128)))
然后测试结果符合我的预期
(100000, 128)
(100000, 128)
所以我认为我的数据可能有问题,但是我不知道从哪里开始。我想知道,如果在某种条件下数据帧出现这种问题。
已添加: 我发现了另外一个。
print(dataframe.ORD_NO[0])
0 22424855
0 22019413
0 21988486
0 22026683
0 22385278
0 21999297
0 22006981
0 22041489
0 22529317
0 22340157
Name: ORD_NO, dtype: object
print(df.ORD_NO[0])
22424855.0
似乎数据帧索引无法正常工作。我希望这种检测有助于解释。