如何通过熊猫跳过多次加载中的某些行

时间:2019-07-18 18:08:34

标签: python pandas merge

我使用熊猫加载了1000多个文件,但是在此之前,我必须占用每个文件的前4行。一个怎么办?我尝试跳过,但在下面的这段代码中不起作用

from google.colab import files
uploaded = files.upload()

from glob import glob
import pandas as pd
dataframes = [pd.read_csv(f) for f in filesnames]
dataframes

输出:

[          Relatório Meteorológico da Estação: Guaratiba
 0     Dados normalizados para o Horário Brasileiro d...
 1     Dia         Hora      HBV   Chuva  DirVento  V...
 2                                          (graus)  ...
 3     01/03/2013  00:00:00          0.0         -   ...
 4     01/03/2013  00:15:00          0.0         -   ...
 5     01/03/2013  00:30:00          0.0         -   ...
 6     01/03/2013  00:45:00          0.0         -   ...
 7     01/03/2013  01:00:00          0.0         -   ...

3 个答案:

答案 0 :(得分:0)

要跳过前三行,可以使用read_csv的skip_rows参数:

df = pd.read_csv(f, skip_rows=3)

您可以执行以下操作保留所有标题:

df = pd.read_csv(f, skip_rows=1) # Skip the first row, use second row as headers
df.drop(df.head(1).index, inplace=True) # Drop the first row of the dataframe

答案 1 :(得分:0)

请检查以下各项是否有效:

dataframes = [pd.read_csv(f,skiprows=4) for f in filesnames]

答案 2 :(得分:0)

它不起作用

我需要将第一个信息放在一列中(第一行没有索引),第二行(索引0)将被删除,而de index 1将是de header。

[墨西哥气象博物馆:瓜拉提巴  0 Dados normalizados para oHorárioBrasileiro d ...  1 Dia Hora HBV Chuva DirVento V ...  2(粗粒)...