对我来说,应该有一种方法可以从文件中读取数据,理想情况下是Pandas DataFrame并以这样的方式创建结果,使其成为笔记本的一部分,例如,您可以正确地存储数据在笔记本电脑中不需要外部文件?
这样你就可以发送整个例子(显然主要用于较小的数据集)。 它也可以使这方面的例子变得更容易......
任何想法?甚至通过剪切和粘贴即输出数据帧显示?
答案 0 :(得分:7)
你可以把它放在一个IPython单元格中:
import pandas as pd
import io
content = '''\
<<PASTE DATA HERE>>
'''
df = pd.read_table(io.BytesIO(content), ...)
答案 1 :(得分:5)
详细说明其他人: 下面的数据框数据只是从IPython Notebook
中的HTML rpr中剪切和粘贴import pandas as pd
import io
content2 = '''\
Units lastqu Uperchg lqperchg fcast errpercent nfcast fctperchg
2000-12-31 19391 NaN NaN NaN NaN NaN NaN NaN
2001-12-31 35068 5925 80.85 NaN 32838 -6.79 NaN NaN
2002-12-31 39279 8063 12.01 36.08 39750 1.18 42449 NaN
2003-12-31 47517 9473 20.97 17.49 44309 -7.24 43784 NaN
2004-12-31 51439 11226 8.25 18.51 49976 -2.93 53594 NaN
2005-12-31 59674 11667 16.01 3.93 51402 -16.09 52907 NaN
2006-12-31 58664 14016 -1.69 20.13 58997 0.56 68491 NaN
2007-12-31 55698 13186 -5.06 -5.92 56313 1.09 55995 NaN
2008-12-31 42235 11343 -24.17 -13.98 50355 16.13 49805 NaN
2009-12-31 40478 7867 -4.16 -30.64 39117 -3.48 32809 NaN
2010-12-31 38722 8114 -4.34 3.14 39915 2.99 41304 NaN
2011-12-31 36965 8361 -4.54 3.04 40714 9.21 39497 NaN
2012-12-31 39132 8608 5.86 2.95 41512 5.73 37690 NaN
2013-12-31 43160 9016 10.29 4.74 42832 -0.77 40376 NaN
2014-12-31 NaN 9785 NaN 8.53 45318 NaN 45665 5
'''
df2 = pd.read_table(io.BytesIO(content2))
df2
导致完全可用的DataFrame