我正在以下列方式更新大型csv文件(~5GB)的特定列中的空行项目。
if df['center'].isnull().any().any() == True: df.loc[df.account.str.startswith('DNA') | df.account.str.startswith('BBA'), 'center'] = "0070"
我通过实现上述方法获得了所需的结果,但是由于要检查和更新的列数超过10列,因此在整个数据集上运行大约需要4-5分钟(~5GB)。有没有更好的方法来提高代码效率?