Question

是否可以在pandas数据帧中从n开始索引？

我将一些数据集保存为csv文件，并希望添加列索引，其行号从上一个文件中最后一个行号结束的位置开始。

例如，对于第一个文件，我使用以下代码，它工作正常，所以我得到一个输出csv文件，行从1到1048574开始，如预期的那样：

yellow_jan ['index'] =范围（1，len（yellow_jan）+ 1）

我想对yellow_feb文件执行相同的操作，但是在1048575开始行索引，依此类推。

感谢任何帮助！

Answer 1

如果你的计划是连接数据框，你可以使用

import pandas as pd
import numpy as np
df1 = pd.DataFrame({"a": np.arange(10)})
df2 = pd.DataFrame({"a": np.arange(10,20)})
df = pd.concat([df1, df2],ignore_index=True)

，否则

df2.index += len(df)

Answer 2

你可以在最后重置索引或定义一个局部变量并在`arange＆＃39;中使用它。功能。使用您读取的每个文件的行数更新变量。

如何索引从n开始的pandas数据帧？

2 个答案: