您可以附加到数据框(例如从df_A -to- df_B),同时将新字段填充到附加数据框(df_B)中吗?
在某些情况下,我会将df_A行添加到df_B中,但是我很乐意在df_B中的字段中填充一个字符串,该字符串解释了为什么在添加时进行添加。我的想法是,我可以使用一个字符串来报告发生了什么错误以及为什么需要从df_A中删除该行。
import pandas as pd
df_A = pd.DataFrame(data={"Acol": [1, 1, 2, 3], "Bcol": [1, 'a', 2, 'b']})
df_B = df_A.loc[df_A['Bcol'].apply(type) == int]
# need to occur at time of append, as this error message should vary with each check
df_B = df_B.assign(NewString='because Bcol was int, etc etc')
答案 0 :(得分:0)
在过滤的数据框上进行分配。
>>> dfa
Acol Bcol
0 1 1
1 1 a
2 2 2
3 3 b
>>> mask = dfa['Bcol'].apply(type) == int
>>> dfb = dfa[mask].assign(New='bbbbb')
>>> dfb
Acol Bcol New
0 1 1 bbbbb
2 2 2 bbbbb
>>>
我觉得这不是您想要的should vary with each check
意味着要进行多次检查,但是dfb = dfa...
的每次迭代都会创建一个新的dfb
。