我有一个pandas数据集:
data = pd.DataFrame([[1,3,3],[2,3,1],[1,3,4]],columns=['C1','C2','C3'])
......我想做两件事:
日期的范围无关紧要,只要它们是随机的并且没有重复。
答案 0 :(得分:3)
import numpy as np
import pandas as pd
data = pd.DataFrame([[1,3,3],[2,3,1],[1,3,4]],columns=['C1','C2','C3'])
data['X'] = np.random.choice(len(data), len(data), replace=False)
data['date'] = pd.to_datetime(data['X'], unit='D')
收益率(类似)
C1 C2 C3 X date
0 1 3 3 2 1970-01-03
1 2 3 1 0 1970-01-01
2 1 3 4 1 1970-01-02
带np.random.choice
的 replace=False
可以保证没有重复项。