我有一个27GB的CSV文件,我想简单地重命名标题行。 我是否可以在不将整个文件读入数据帧然后再次写入整个文件的情况下执行此操作?
这基本上就是我想做的,但不重写整个27GB文件。
data = pd.read_csv(filename,sep="|",nrows=2)
data.head()
LOC_ID UPC FW BOP_U BOP_$
0 17 438531560821 201712 1 40.0
1 239 438550152328 201719 2 28.8
data.columns = ['WHSE','SKU','PERIOD','QUANTITYONHAND','DOLLARSONHAND']
data.head()
WHSE SKU PERIOD QUANTITYONHAND DOLLARSONHAND
0 17 438531560821 201712 1 40.0
1 239 438550152328 201719 2 28.8
答案 0 :(得分:1)
只需指定只有一行nrows
。
header_df = pd.read_csv('my_file.csv', index_col=0, nrows=1)
至于重写文件,我不认为你必须处理整个文件才能重写。