"在开始实施任何学习算法之前,如果可能,最好可视化数据"。
这句话来自Andrew Ng"机器学习"。
我想使用Logistic回归来预测Age(泰坦尼克号)的缺失值。我的目标不是获得最好的结果,而是为了好玩。
但我不知道如何将6个维度可视化: 1.Pclass 2.性 3.年龄 4. SibSp 5. Parch 6.票价开始
Andrew Ng讲述了一些二维的例子。可视化数据很容易。但是,如果我有6个维度,我如何可视化数据(找到Age的缺失值)?
也许我可以使用主成分分析(PCA)来降低维数,但我希望我能找到比PCA更简单的方法(Andrew Ng告诉PCA有利于减少维数)
答案 0 :(得分:1)
我这样做的方式是假装结构是一个列表列表,因为它就是它的真实含义。所以,在Python中,如果你有几个列表可供使用,你可以将这些列表放在自己的列表中,例如L = [[a,b,c],[a1,b1,c1],[a2,b2 ,C2]。那么如果a,b,c,a1等中的每一个都是一个列表呢?我不会把它写出来以避免让你感到困惑,但你可以很容易地想象实现它会如此简单 - 只需为第三维成员添加另一层方括号即可。你可以以这种方式尽可能地深入。