Question

Pandas中的列名分配是否有理由支持大写优于小写？

示例：

dframe = DataFrame({'city':['Alma','Brian Head', 'Fox Park'],
                    'altitude':[3158,3000,2762]})

返回一个DataFrame，其中包含高度为城市的列。

鉴于：

dframe = DataFrame({'City':['Alma','Brian Head', 'Fox Park'],
                    'altitude':[3158,3000,2762]})

返回一个DataFrame，其中包含城市，海拔高度的列。

这个pandas是特定的还是一般的python行为？

Answer 1

你实际上并没有问这个问题，但我假设有关于如何保留原始订单的隐含问题？如果是这样，有以下三种方式：

1）相同的基本字典构造函数，但包装在collections.OrderedDict中（感谢@ shx2进行更正）：

from collections import OrderedDict
df1 = pd.DataFrame( OrderedDict([ ('city',['Alma','Brian Head', 'Fox Park']),
                                  ('altitude',[3158,3000,2762]) ]))

2）非字典构造函数，您可以分别指定数据数组和列名，但是，这实际上需要以行为中心的条目，而不是像字典构造函数那样以列为中心：

lst = [['Alma','Brian Head','Fox Park'],
       [3158,3000,2762]]
df2 = pd.DataFrame( map(list, zip(*lst)),
                    columns = ['city','altitude'] )

3）最简单的方法可能就是在创建数据帧后指定顺序（感谢@EdChum捕获原始帖子中的错误）：

df3 = df[['city','altitude']]

测试所有三个结果是否相同：

In [149]: all(df1==df2)
Out[149]: True

In [150]: all(df1==df3)
Out[150]: True

pandas列名称赋值的大写优先级

1 个答案: