解析熊猫列

时间:2019-03-25 22:27:59

标签: python pandas

我正在尝试获取用逗号分隔的列中的信息,并选择某些片段。例如,该列如下所示:

(500、411、130、816)

在任何情况下,我希望能够提取某些值,例如500。

我试图通过数据框的CSV代码传递代码,以选择我想要的列,但是当我尝试通过新数据框并缩小信息范围时,我仍然得到了相同的结果信息。

def parseFaultCodes(self):
        #df = pandas.read_csv('modified_example.csv')
        #faultCodes = df[(df.RDR == 514)]
        #faultCodes.to_csv('selected_codes.csv')

该代码是我尝试过的,但是它仍然只返回我之前拥有的所有相同信息,而不是找到任何514实例。

1 个答案:

答案 0 :(得分:0)

以下是使用通用Series.apply的一种可能方法:

df = pd.DataFrame({
    'id':['A1','A2','A3'],
     'A1':['(500, 600, 700)','(510, 610, 710)','(520, 620, 720)']
})

df['A1_0'] = df.A1.apply(lambda x: x.replace('(','').replace(')','').split(',')[0])

结果:

enter image description here