我正在编写一个函数,该函数创建一个数据框并向其添加新列。此新列是基于其他列数据的哈希:
df['uniqueid'] = df[['column_a', 'column_b', ... 'column_x']].\
apply(lambda x: ed.generate_unique_ids(
[
x['column_a'],
x['column_b'],
...
x['column_x']
]), axis=1)
是否可以在更具可读性的地方编写此代码?我不确定如何提高可读性。
基本上,我想选择几列并将其传递给其他函数,这些函数将根据这些值为我提供哈希值。
我是Python和大熊猫的新手。
答案 0 :(得分:1)
这更多是一个代码审查问题,但是您可以通过遍历基础列表/数组并将它们直接传递给列表理解内的函数来提高性能和可读性。
cols = ['column_a', 'column_b', ... 'column_x']
df['unique_id'] = [ed.generate_unique_ids(r) for r in df[cols].values.tolist()]