熊猫:如何应用自定义函数将自由文本列拆分为结构化数据?

时间:2017-02-26 16:28:45

标签: python pandas

我在 DataFrame 中有一个自由文本列,我为此开发了自定义处理程序:

a, b, c, d, e, f = my_transform(text_column)

如何将其应用于DataFrame以创建包含转换结果的6个新列 a,b,c,d,e,f

1 个答案:

答案 0 :(得分:1)

如果没有你的功能,它有点问题,但如果返回Series

则有效
df = pd.DataFrame({'text_column':['abgdeftk', 'ewerfsfs']})
print (df)
  text_column
0    abgdeftk
1    ewerfsfs

def my_transform(x):
    #some sample fransformation 
    a = x[0]
    b = x[1]
    c = x[2]
    d = x[3]
    e = x[4]
    f = x[5]

    return pd.Series([a,b,c,d,e,f])

print (df.text_column.apply(my_transform))
   0  1  2  3  4  5
0  a  b  g  d  e  f
1  e  w  e  r  f  s