将文本表转换为pandas数据帧

时间:2017-04-02 19:12:19

标签: python pandas dataframe text-editor

很多时候,当我试图回答Stackoverflow上的问题时,问题包含一个表,我必须将其转换为pandas数据帧才能处理。例如,在这个问题中:

http://stackoverflow.com/questions/43172116/pandas-count-some-value-in-all-columns

我的问题是,是否有更快的方法将其转换为数据帧而不是写入:

df=pd.DataFrame({'graph':[1,2,3,4,5,6],
0:['blue','blue','red','red','blue','blue'],
1:['blue','blue','red','blue','red','blue'],
2:['blue','blue','blue','red','blue','blue'],
3:['blue','blue','blue','red','red','blue'],
4:['blue','blue','red','blue','red','blue']})

鉴于我可以复制文本:

graph   0       1       2       3       4
1       blue    blue    blue    blue    blue
2       blue    blue    blue    blue    blue
3       blue    red     blue    blue    red
4       red     blue    red     red     blue
5       red     red     blue    red     red
6       blue    blue    blue    blue    blue

1 个答案:

答案 0 :(得分:6)

确保所需数据集在剪贴板中并使用pd.read_clipboard()方法。

一步一步:

  1. 标记所需的数据集
  2. Ctrl + C (对于MS Windows)
  3. 执行:df = pd.read_clipboard()
  4. In [40]: df = pd.read_clipboard()
    
    In [41]: df
    Out[41]:
       graph     0     1     2     3     4
    0      1  blue  blue  blue  blue  blue
    1      2  blue  blue  blue  blue  blue
    2      3  blue   red  blue  blue   red
    3      4   red  blue   red   red  blue
    4      5   red   red  blue   red   red
    5      6  blue  blue  blue  blue  blue