Question

我有一个形状的熊猫数据框（3000,60630）。我正在处理二进制分类问题。有12126个填充细节，每个细节都代表填充功能。

onCreate

为了简化构建ML模型，我给出了从1到60630的列号。但是现在我需要检索原始的垫子细节。

在每个12126列后，我需要重新开始1.我不想在原始数据框中进行更改。出于报告目的，我需要这些细节。

    First 12126 columns-feature 1
    2nd 12126 columns-feature 2
    3rd 12126 columns-feature 3
    4th 12126 columns-feature 4
    5th 12126 columns feature 5

In total 60630 columns.

Answer 1

IIUC：

In [5]: df = pd.DataFrame(np.random.randint(100, size=(3, 60630)))

In [6]: df.columns
Out[6]: RangeIndex(start=0, stop=60630, step=1)

In [7]: i = 0

In [8]: df.iloc[:, 12126*i:12126*(i+1)].columns
Out[8]: RangeIndex(start=0, stop=12126, step=1)

In [9]: i = 1

In [10]: df.iloc[:, 12126*i:12126*(i+1)].columns
Out[10]: RangeIndex(start=12126, stop=24252, step=1)

从pandas dataframe列号中减去预定义值并返回新数字

1 个答案: