如何使用条件数据框来验证数据框?

时间:2018-07-30 18:48:40

标签: python excel pandas

我正在寻找问题的解决方案。我有一个必须适合特殊设置的excel文件,因此它必须具有特定的列,并且行必须具有特定的数字范围。

那么是否可以复制我的excel文件并将其用作模板?在此模板中,我将用一个字符串替换所有数字,该字符串代表一个数字的条件,该数字恰好在另一个excel文件中的此位置(单元格)。

假设我有一个Excel文件的数据框:

|headline|headline2|headline3|
|--------|---------|---------|
|30      |1.0      |abc      |
|80      |0.5      |cda      |
|--------|---------|---------|

是否可以加载另一个文件,就像条件模板一样,以便我可以验证上面DataFrame的数据? 模板看起来像这样的DataFrame:

|headline  |headline2|headline3|
|----------|---------|---------|
|>0 & <100 |>0 & <1  |string   |
|>0 & <100 |>0 & <1  |string   |
|----------|---------|---------|

加载需要验证的excel文件并将其与模板进行比较,将为我提供一个仅包含错误条目的新DataFrame。就像一个数字大于100,或者它是一个字符串而不是整数。

也许可以只将组名写入模板的单元格中,以便程序知道需要什么条件。然后,我可以在模板中输入特定的组。然后,我可以将这些组混合在模板的不同单元格中。

|headline|headline2|headline3|
|--------|---------|---------|
|group1  |group2   |group3   |
|group3  |group2   |group2   |
|--------|---------|---------|

可以在这样的地方定义组:

group1 = >0 & <100
group2 = >0 & <1
group3 = string

0 个答案:

没有答案