Question

我试图从500行的数据集中随机抽取150行。所以我会随机做。

我的数据

 object,color,label
 puppy,white,animal
 mango,orange,fruit
 pants,black,clothing

我的脚本

 import pandas
 import pandas as pd

 df = pd.read_csv ('data.csv', sep = ',')
 data_random = df.sample (150)

 print (data_random)

但是结果很奇怪，我没有完整的内容...

     object ... label
 277 grape  ... fruit
 116 bear   ... animal
 495 ...    ... ...

可能有完整的行吗？

Answer 1

您可以检查docs中的熊猫0.23.0：

以前，最大列数的默认值为 pd.options.display.max_columns = 20 。这意味着相对较宽的数据帧将无法容纳在终端宽度之内，而熊猫会引入换行符以显示这20列。

如果Python在终端中运行，现在将自动确定最大列数，以使打印的数据框适合当前终端宽度（pd.options.display.max_columns = 0）（GH17023）。如果Python作为Jupyter内核（例如Jupyter QtConsole或Jupyter笔记本，以及在许多IDE中运行）运行，则该值无法自动推断，因此与以前的版本一样设置为20。在终端中，这将产生更好的输出。

请注意，如果您不喜欢新的默认设置，则可以随时自行设置此选项。要恢复为旧设置，您可以运行以下行：

pd.options.display.max_columns = 20

Answer 2

如前所述，检查Pandas选项：

pd.options.display.max_columns = 20

否则，请检查您的编辑器的设置，然后在Jupyter Notebook中尝试

使用pandas随机抽取数据集

2 个答案: