使用pandas随机抽取数据集

时间:2018-08-24 07:54:37

标签: python pandas

我试图从500行的数据集中随机抽取150行。所以我会随机做。

我的数据

 object,color,label
 puppy,white,animal
 mango,orange,fruit
 pants,black,clothing

我的脚本

 import pandas
 import pandas as pd

 df = pd.read_csv ('data.csv', sep = ',')
 data_random = df.sample (150)

 print (data_random)

但是结果很奇怪,我没有完整的内容...

     object ... label
 277 grape  ... fruit
 116 bear   ... animal
 495 ...    ... ...

可能有完整的行吗?

2 个答案:

答案 0 :(得分:2)

您可以检查docs中的熊猫0.23.0:

  

以前,最大列数的默认值为 pd.options.display.max_columns = 20 。这意味着相对较宽的数据帧将无法容纳在终端宽度之内,而熊猫会引入换行符以显示这20列。

     

如果Python在终端中运行,现在将自动确定最大列数,以使打印的数据框适合当前终端宽度(pd.options.display.max_columns = 0)(GH17023)。如果Python作为Jupyter内核(例如Jupyter QtConsole或Jupyter笔记本,以及在许多IDE中运行)运行,则该值无法自动推断,因此与以前的版本一样设置为20。在终端中,这将产生更好的输出。


  

请注意,如果您不喜欢新的默认设置,则可以随时自行设置此选项。要恢复为旧设置,您可以运行以下行:

pd.options.display.max_columns = 20

答案 1 :(得分:1)

如前所述,检查Pandas选项:

pd.options.display.max_columns = 20

否则,请检查您的编辑器的设置,然后在Jupyter Notebook中尝试