我正在学习python 3。
我从sklearn导入了数据集。 当我打印它时,它看起来很奇怪。 我应该使用什么命令来查看清晰组织的数据:列,行。
import statsmodels.api as sm
from sklearn import datasets
data = datasets.load_boston()
print(data)
答案 0 :(得分:2)
熊猫印花更漂亮。试试这个:
import pandas as pd
df = pd.DataFrame(data['data'])
print(df)
答案 1 :(得分:2)
首先,您需要了解根据official documentation创建的对象数据具有这些属性:
data['data']
是一个len()
506数组。每个元素都有13个其他元素,因此len(data['data'][1])
实际上返回13。data['feature_names']
作为“列名称”,它有13个字符串元素。现在,通过该信息,您可以理解,要打印表格,您可以使用data['feature_names']
打印标题并在data['data']
内打印行。
抓住这个tabular data snippet in python,您可以使用制表模块很好地打印它。
from tabulate import tabulate
print tabulate(data['data'], headers=data['feature_names'])
结果如下:
CRIM ZN INDUS CHAS NOX RM AGE DIS RAD TAX PTRATIO B LSTAT
0.00632 18 2.31 0 0.538 6.575 65.2 4.09 1 296 15.3 396.9 4.98
0.02731 0 7.07 0 0.469 6.421 78.9 4.9671 2 242 17.8 396.9 9.14
0.02729 0 7.07 0 0.469 7.185 61.1 4.9671 2 242 17.8 392.83 4.03
0.03237 0 2.18 0 0.458 6.998 45.8 6.0622 3 222 18.7 394.63 2.94
很抱歉,如果我以错误的方式解释数据,我不明白'加载并返回波士顿房价数据集'代表什么,但是,这应该可以帮助您以表格方式打印数据。
答案 2 :(得分:1)
for row in data:
print("{: >20} {: >20} {: >20}".format(*row))
这将生成一个包含三列的布局。