我有许多以数据框形式读取的Excel电子表格,并且其中一些电子表格中的行无法正确解析或出现空白/空值。我不在乎解析错误的值,或者为空或为空。
我想遍历每个数据框。如果单元格包含给定的字符串,我想将该ROW设置为标题行,并忽略其上方的所有行。我不知道该怎么写。我是python的新手,有帮助吗?
我了解如何将特定的行设置为新的数据框标题。但是,我不知道如何对此进行概括。我们不知道哪一行将包含所需的字符串。如果总是第四行,那么伤口很简单,我们可以在读取csv时设置标头。
我认为这需要像这样吗?
df[df.str.contains("date").iloc[0]
此字符串条件显然不起作用。我的问题是,如果我们不知道字符串“ date”将首先出现在哪一列中,该如何对此进行概括。
本质上:无论“ date”的第一个实例出现在哪个位置,我们都希望将该行作为标题行。
编辑:人们一直说这是重复的。我不明白如何在另一个问题中概括该解决方案...