如何读取大数据帧中的第一个块?

时间:2016-08-10 01:51:33

标签: csv pandas dataframe

我有一个3GB的文件,pd.read_csv(...)崩溃了我的iPython笔记本,所以我写了(风格不好)

df = pd.read_csv("train.csv", chunksize=10**6)

for chunk in df:
    print chunk
    break

更正确的是什么?我只想看到第一百万行。

1 个答案:

答案 0 :(得分:2)

您可以尝试read_csv参数reader = pd.read_csv("train.csv", iterator=True) df = reader.get_chunk(10**6)

if (convertView == null) {
   ...
} else {
   ...
}
textViewAndroid.setText(gridViewString[i]);
Picasso
       .with(mContext)
       .load(gridViewImageId[i])
       .fit() // will explain later
       .into((ImageView) imageViewAndroid);
return gridViewAndroid;

如果它仍然很大,你可以在一个循环中读取(并可能转换或写回一个新文件)较小的块,直到你得到你需要的东西。