对于StackOverflow上的pandas相关问题,人们通常会提供如下样本数据:
a b c d e
0 -0.420430 -0.394562 0.760232 0.152246 -0.671229
1 0.388447 0.676054 -0.058273 -0.246588 0.811332
2 -0.498263 -0.108011 0.952489 0.504729 -0.385724
3 1.069371 0.143752 0.414916 -1.180362 -0.029045
4 -0.245684 -0.150180 0.210579 0.063154 0.261488
5 0.064939 -0.396667 0.857411 -0.460206 0.039658
在我自己的jupyer笔记本中创建数据的最有效方法是什么,所以我可以进一步研究这个问题?
通常,我会将数据复制到记事本并用逗号替换空格并执行以下代码来创建sameple数据:
data = np.array([-0.420430,-0.394562,0.760232,0.152246,...]) # paste the result from notepad here
df = pd.DataFrame(data.reshape(-1,5),columns=[HEADERS_OF_DATA]) # 5 is number of columns
然而,这非常缓慢且不方便。有没有更快的方法呢?
答案 0 :(得分:0)
奇妙的是,您可以使用pd.read_clipboard()
执行此操作。
只需从问题中复制发布的DataFrame,然后这行代码将使用pd.read_table()
将其解析为DataFrame:
df = pd.read_clipboard()