很多时候,当我试图回答Stackoverflow上的问题时,问题包含一个表,我必须将其转换为pandas数据帧才能处理。例如,在这个问题中:
http://stackoverflow.com/questions/43172116/pandas-count-some-value-in-all-columns
我的问题是,是否有更快的方法将其转换为数据帧而不是写入:
df=pd.DataFrame({'graph':[1,2,3,4,5,6],
0:['blue','blue','red','red','blue','blue'],
1:['blue','blue','red','blue','red','blue'],
2:['blue','blue','blue','red','blue','blue'],
3:['blue','blue','blue','red','red','blue'],
4:['blue','blue','red','blue','red','blue']})
鉴于我可以复制文本:
graph 0 1 2 3 4
1 blue blue blue blue blue
2 blue blue blue blue blue
3 blue red blue blue red
4 red blue red red blue
5 red red blue red red
6 blue blue blue blue blue
答案 0 :(得分:6)
确保所需数据集在剪贴板中并使用pd.read_clipboard()方法。
一步一步:
df = pd.read_clipboard()
In [40]: df = pd.read_clipboard()
In [41]: df
Out[41]:
graph 0 1 2 3 4
0 1 blue blue blue blue blue
1 2 blue blue blue blue blue
2 3 blue red blue blue red
3 4 red blue red red blue
4 5 red red blue red red
5 6 blue blue blue blue blue