Question

我总共有343个数据框，具有不同的列结构。我想从第一个出现的列的第一行找到文本。 excel文件中的实际数据：

预期结果：

firstRowtext： Q60h。当我阅读每一篇文章时，请告诉我

输出df（列名为列1,2,3,4,5,6,7）：

Answer 1

我相信您需要两次读取每个文件 - 首先是第一个值，跳过行然后再使用参数skiprows：

files = glob.glob('data\*.xlsx')

for f in files:
    df = pd.read_excel(f, index_col=False)
    val = df.columns[0].split()[0]
    print (val)
    pos = df.iloc[:, 0].notnull().idxmax() + 1
    df = pd.read_excel(f, skiprows=pos, header=None).dropna(axis=1, how='all')

如何查找数据存在的第一个数据列＆amp;删除不需要的行，Python 3.6

1 个答案: