在Pandas中更有效地清理数据

时间:2016-08-14 00:51:08

标签: python pandas data-cleaning

我有一个python脚本从streetinsider.com提取EPS信息。目前我正在使用完全低效的方法清理数据,如下所示。想知道是否有人可以展示如何更有效地完成这项工作。

以下示例非常精简,有更多列和更多行。

eps_table = DataFrame({'% Beat': '+1,405%', '% Week': '+123%'}, index=[0])

things_to_remove = ['% Beat', '% Week']
for i in things_to_remove:
    eps_table[i] = eps_table[i].replace("%", "",regex=True)
    eps_table[i] = eps_table[i].replace("\+", "", regex=True)
    eps_table[i] = eps_table[i].replace("\,", "", regex=True)

感谢。

2 个答案:

答案 0 :(得分:4)

立刻完成所有工作:

eps_table.replace(r'[%+,]', '', regex=True)

答案 1 :(得分:1)

这可能是最简单的方法:

eps_table.replace('\+', '', regex=True).replace('%', '', regex=True).replace(',', '', regex=True)

输出:

    % Beat % Week
0   1405    123