我正在尝试处理一组“大”数据。这是一个具有5k行和30列的Excel工作表。存储在单元格中的大多数数据是字符串。我要做的就是对这些数据执行简单的任务,例如:
字符串的重复次数
检查应遵循同一行中数据的一些规则(如果需要检查则只需几个)
依此类推...
我的第一个尝试是创建5k个对象(每行1个对象),对其中的数据进行充电,然后开始运行测试。但是将数据保存在这些对象中仅花了一个小时(仅1k行)。我在python中使用只读模式的openpyexcel模块完成了此操作。
我的问题是...有更快的方法吗?
在这里回答我的问题 link