我有一个形状的熊猫数据框(3000,60630)。我正在处理二进制分类问题。有12126个填充细节,每个细节都代表填充功能。
onCreate
为了简化构建ML模型,我给出了从1到60630的列号。但是现在我需要检索原始的垫子细节。
在每个12126列后,我需要重新开始1.我不想在原始数据框中进行更改。出于报告目的,我需要这些细节。
First 12126 columns-feature 1
2nd 12126 columns-feature 2
3rd 12126 columns-feature 3
4th 12126 columns-feature 4
5th 12126 columns feature 5
In total 60630 columns.
答案 0 :(得分:1)
IIUC:
In [5]: df = pd.DataFrame(np.random.randint(100, size=(3, 60630)))
In [6]: df.columns
Out[6]: RangeIndex(start=0, stop=60630, step=1)
In [7]: i = 0
In [8]: df.iloc[:, 12126*i:12126*(i+1)].columns
Out[8]: RangeIndex(start=0, stop=12126, step=1)
In [9]: i = 1
In [10]: df.iloc[:, 12126*i:12126*(i+1)].columns
Out[10]: RangeIndex(start=12126, stop=24252, step=1)