让我们说我有一系列的
import pandas as pd
a = pd.Series([1, 2, 3])
是否有更有效的方法来创建百万行df而不是
chamillion_row_df = pd.concat([a] * 1000000)
答案 0 :(得分:2)
您可以使用np.tile
:
pd.Series(np.tile(a.values, 1000000))
这比将临时列表构建为pd.concat
<强>定时强>
In [42]:
%timeit pd.Series(np.tile(a.values, 1000000))
%timeit pd.concat([a] * 1000000)
100 loops, best of 3: 17.7 ms per loop
1 loops, best of 3: 16.9 s per loop
所以使用np.tile