如何查找数据存在的第一个数据列&删除不需要的行,Python 3.6

时间:2017-09-19 11:22:44

标签: python python-3.x pandas dataframe

我总共有343个数据框,具有不同的列结构。我想从第一个出现的列的第一行找到文本。 excel文件中的实际数据: enter image description here

预期结果:

firstRowtext: Q60h。当我阅读每一篇文章时,请告诉我

输出df(列名为列1,2,3,4,5,6,7): enter image description here

1 个答案:

答案 0 :(得分:1)

我相信您需要两次读取每个文件 - 首先是第一个值,跳过行然后再使用参数skiprows

files = glob.glob('data\*.xlsx')

for f in files:
    df = pd.read_excel(f, index_col=False)
    val = df.columns[0].split()[0]
    print (val)
    pos = df.iloc[:, 0].notnull().idxmax() + 1
    df = pd.read_excel(f, skiprows=pos, header=None).dropna(axis=1, how='all')