如何在 for 循环中使用 if 语句来清理数据?

时间:2020-12-23 21:31:35

标签: python for-loop if-statement data-cleaning

所以我有一个机构数据框。其中一些机构是同一个上级机构的一部分,但名称的书写方式有不同的变化(例如:美国陆军是上级机构,但可以在我的列表中找到陆军、美国陆军、美国陆军、武装部队等)。我有一个单独的数据框(键),其中列出了这些变体(称为 Agency_variations)以及它们相关的父代理(称为 parent_agency)。

我正在尝试做一个 if 语句。我的思考过程是:

如果agency_name 在key.agency_variations 中:打印key.parent_agency。否则:打印agency_name

理想情况下,我希望将其打印到新列中。我想我可以通过创建一个空的数据框,然后将值附加到它并可能将其加入原始数据框来做到这一点。任何帮助将不胜感激。这是我的想法:

new = []
for n in agency_name:
    if "n" in "key.agency_variations":
        new.append(key.parent_agency)
    else:
        new.append('n')

这里的问题是,它附加了 key.parent_agency 的整列,而不是仅仅与与 Agency_name 匹配的 agent_variation 对应的那一列。

0 个答案:

没有答案