Question

我想对熊猫数据框进行“ n”次混洗，并用新名称保存洗过的数据框，然后将其导出到“ csv”文件中。我的意思是-

import pandas as pd
import sklearn
import numpy as np
from sklearn.utils import shuffle

df = pd.read_csv('example.csv')

然后像这样-

for i in np.arange(n):
    df_%i = shuffle(df)
    df_%i.to_csv('example.csv')

感谢您的帮助。谢谢！

Answer 1

您可以使用

for i in range(n):
    df.sample(frac= 1).to_csv(f"example_{i}.csv")

Answer 2

如果需要创建任意数量的变量，则应将它们存储在字典中，以后可以通过它们的键引用它们；在这种情况下，您要遍历的整数。

d = {}
for i in range(n):
    d[i] = df.sample(frac=1)  #d[i] = shuffle(df) in your case
    d[i].to_csv(f'example_{i}.csv')

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randint(1, 10, (3, 3)))

d = {}
for i in range(5):
    d[i] = df.sample(frac=1)

d[1]
#   0  1  2
#0  6  3  2
#1  7  6  4
#2  2  6  9

d[2]
#   0  1  2
#2  2  6  9
#1  7  6  4
#0  6  3  2

将panda数据帧随机洗净n次，并每次重命名

2 个答案: