我有一个数据框,其中第4列包含ASCII值。
mydict=[('1385145553847005',
'54',
'NPAVIN',
'9175042231172',
'[89,111,117,114,32,78,80,65,86,32,79,110]',
'20131123000914',
'NA',
'NA',
'0',
'0',
'NA',
'undefined',
'a4d05539-cd61-43ee-a870-702e20caeaff',
'0',
'0',
'0'),
('1385145553847006',
'55',
'NPAVIN1',
'9175042231171',
'[78,80,65,86,32,79,110]',
'20131123000915',
'NA',
'NA',
'0',
'0',
'NA',
'undefined',
'a4d05539-cd61-43ee-a870-702e20caeaff',
'0',
'0',
'0')
]
import pandas as pd
df = pd.DataFrame(mydict)
我编写了一个需要应用于第4列的函数。
def get_ascii(amyl):
mys=''
for item in amyl:
mys= mys+(chr(int(item)))
return mys
这不起作用。我得到了值错误:
df.apply(get_ascii(df[4]))
预期成果: 应将以下2个值添加到数据框的最后一列。
'Your NPAV On'
'NPAV On'
答案 0 :(得分:1)
这里存在许多问题,您的值是值列表的文字字符串:
In [295]:
df[4]
Out[295]:
0 [89,111,117,114,32,78,80,65,86,32,79,110]
1 [78,80,65,86,32,79,110]
Name: 4, dtype: object
我不知道这是否有意,但您必须将其转换为列表。
其次你的函数正在处理整个系列,但是如果你想在传递参数axis=1
时传递一行,那么它一次只需要一行值。
无论如何,下面的工作是评估传入的系列,访问该系列中唯一的元素值,评估为列表然后执行音译:
In [294]:
import ast
def get_ascii(amyl):
l = ast.literal_eval(amyl.values[0])
mys=''
for item in l:
mys= mys+(chr(item))
return mys
df[[4]].apply(get_ascii, axis=1)
Out[294]:
0 Your NPAV On
1 NPAV On
dtype: object