是否可以在pandas数据帧中从n开始索引?
我将一些数据集保存为csv文件,并希望添加列索引,其行号从上一个文件中最后一个行号结束的位置开始。
例如,对于第一个文件,我使用以下代码,它工作正常,所以我得到一个输出csv文件,行从1到1048574开始,如预期的那样:
yellow_jan ['index'] =范围(1,len(yellow_jan)+ 1)
我想对yellow_feb文件执行相同的操作,但是在1048575开始行索引,依此类推。
感谢任何帮助!
答案 0 :(得分:0)
如果你的计划是连接数据框,你可以使用
import pandas as pd
import numpy as np
df1 = pd.DataFrame({"a": np.arange(10)})
df2 = pd.DataFrame({"a": np.arange(10,20)})
df = pd.concat([df1, df2],ignore_index=True)
,否则
df2.index += len(df)
答案 1 :(得分:0)
你可以在最后重置索引或定义一个局部变量并在`arange'中使用它。功能。使用您读取的每个文件的行数更新变量。