Question

对于StackOverflow上的pandas相关问题，人们通常会提供如下样本数据：

          a         b         c         d         e
0 -0.420430 -0.394562  0.760232  0.152246 -0.671229
1  0.388447  0.676054 -0.058273 -0.246588  0.811332
2 -0.498263 -0.108011  0.952489  0.504729 -0.385724
3  1.069371  0.143752  0.414916 -1.180362 -0.029045
4 -0.245684 -0.150180  0.210579  0.063154  0.261488
5  0.064939 -0.396667  0.857411 -0.460206  0.039658

在我自己的jupyer笔记本中创建数据的最有效方法是什么，所以我可以进一步研究这个问题？

通常，我会将数据复制到记事本并用逗号替换空格并执行以下代码来创建sameple数据：

data = np.array([-0.420430,-0.394562,0.760232,0.152246,...]) # paste the result from notepad here
df = pd.DataFrame(data.reshape(-1,5),columns=[HEADERS_OF_DATA]) # 5 is number of columns

然而，这非常缓慢且不方便。有没有更快的方法呢？

Answer 1

奇妙的是，您可以使用pd.read_clipboard()执行此操作。

只需从问题中复制发布的DataFrame，然后这行代码将使用pd.read_table()将其解析为DataFrame：

df = pd.read_clipboard()

从StackOverflow内容创建数据框样本的最快方法

1 个答案: