我正在构建一个需要分析表格数据的应用程序。
我想执行一些列式操作,例如重命名列,删除列以及根据现有列的值计算新列的功能。
我的第一选择就像Pandas,但是一个限制是这个项目必须是跨平台的,并且很容易在virtualenv中部署。 Pandas(在W32上)似乎使用了不容易处理的二进制安装程序。
我的第二选择是推出自己的桌级课程,但我希望这不会是必要的。
那还有其他选择吗?
UPDATE1 :Anaconda,是的,这是一个很棒的套餐,但是我不能自由选择我自己的平台。该平台已经为我选择:它是Vanilla CPython 2.7.3 32bit。没有服务器具有C ++编译器。引入任何新的非python依赖项是有代价的,因为我必须确保任何使用它的开发人员都有这些组件,因此保持纯粹的python将是有价值的。
UPDATE2 :表格数据是什么意思?非正式地,它可能是您在SQL数据库中的电子表格或表中表示的数据类型。
在这种情况下,它们是按行和列组织的结构化数据。每列都是一致的类型,但可以是None。每列都有一个字符串名称。列有订单。