我希望在Python中找到N维空间的质心。我有一个带K列的数据框(一些包含文本,一些包含数字)
{X1 ...值Xk} ... {Z1..Zk}
k> 10000
我需要计算数据框中所有数值的质心。
最好的方法是什么?
答案 0 :(得分:0)
质心只是每个维度上的值的平均值,您只想在非对象列上计算它,所以:
df.ix[:,df.dtypes != 'O'].mean()
编辑:虽然OP只提到了“文字”和“数字”,但以下替代方案确实更为通用(感谢MaxU):
df.select_dtypes(include=['number']).mean()