Question

我有一个数据框，其中第4列包含ASCII值。

mydict=[('1385145553847005',
  '54',
  'NPAVIN',
  '9175042231172',
  '[89,111,117,114,32,78,80,65,86,32,79,110]',
  '20131123000914',
  'NA',
  'NA',
  '0',
  '0',
  'NA',
  'undefined',
  'a4d05539-cd61-43ee-a870-702e20caeaff',
  '0',
  '0',
  '0'),
('1385145553847006',
  '55',
  'NPAVIN1',
  '9175042231171',
  '[78,80,65,86,32,79,110]',
  '20131123000915',
  'NA',
  'NA',
  '0',
  '0',
  'NA',
  'undefined',
  'a4d05539-cd61-43ee-a870-702e20caeaff',
  '0',
  '0',
  '0')
] 

import pandas as pd
df = pd.DataFrame(mydict)

我编写了一个需要应用于第4列的函数。

def get_ascii(amyl):
    mys=''
    for item in amyl:
        mys= mys+(chr(int(item)))
    return mys

这不起作用。我得到了值错误：

df.apply(get_ascii(df[4]))

预期成果：应将以下2个值添加到数据框的最后一列。

'Your NPAV On'
'NPAV On'

Answer 1

这里存在许多问题，您的值是值列表的文字字符串：

In [295]:

df[4]
Out[295]:
0    [89,111,117,114,32,78,80,65,86,32,79,110]
1                      [78,80,65,86,32,79,110]
Name: 4, dtype: object

我不知道这是否有意，但您必须将其转换为列表。

其次你的函数正在处理整个系列，但是如果你想在传递参数axis=1时传递一行，那么它一次只需要一行值。

无论如何，下面的工作是评估传入的系列，访问该系列中唯一的元素值，评估为列表然后执行音译：

In [294]:

import ast
def get_ascii(amyl):
    l = ast.literal_eval(amyl.values[0])
    mys=''
    for item in l:
        mys= mys+(chr(item))           
    return mys
df[[4]].apply(get_ascii, axis=1)
Out[294]:
0    Your NPAV On
1         NPAV On
dtype: object

应用函数数据框列

1 个答案: