我有这个数据框
sal.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 127606 entries, 0 to 127605
Data columns (total 6 columns):
id 127606 non-null int64
start 127606 non-null object
end 127606 non-null object
cc 127606 non-null float64
ep 58505 non-null float64
ip 58465 non-null float64
dtypes: float64(3), int64(1), object(2)
memory usage: 5.8+ MB
此时此刻,我已经免费获得8 GB ram中的5个,但是一旦我运行
sal.iloc[1]
它会消耗我的整个内存和系统崩溃。 我不知道它为什么会发生,因为我已经轻松地使用df的4倍大小。它甚至不打印第一行!!
如果幸运的话,内核中断工作(否则它会冻结并需要重启)。 然后我做了一个gc: -
import gc
gc.collect()
out : 4297
伙计们有什么想法,以及如何解决这个问题?
我在Anaconda jupyter笔记本上,版本1.7,64bit,python 3