Question

我使用熊猫加载了1000多个文件，但是在此之前，我必须占用每个文件的前4行。一个怎么办？我尝试跳过，但在下面的这段代码中不起作用

from google.colab import files
uploaded = files.upload()

from glob import glob
import pandas as pd
dataframes = [pd.read_csv(f) for f in filesnames]
dataframes

输出：

[          Relatório Meteorológico da Estação: Guaratiba
 0     Dados normalizados para o Horário Brasileiro d...
 1     Dia         Hora      HBV   Chuva  DirVento  V...
 2                                          (graus)  ...
 3     01/03/2013  00:00:00          0.0         -   ...
 4     01/03/2013  00:15:00          0.0         -   ...
 5     01/03/2013  00:30:00          0.0         -   ...
 6     01/03/2013  00:45:00          0.0         -   ...
 7     01/03/2013  01:00:00          0.0         -   ...

Answer 1

要跳过前三行，可以使用read_csv的skip_rows参数：

df = pd.read_csv(f, skip_rows=3)

您可以执行以下操作保留所有标题：

df = pd.read_csv(f, skip_rows=1) # Skip the first row, use second row as headers
df.drop(df.head(1).index, inplace=True) # Drop the first row of the dataframe

Answer 2

请检查以下各项是否有效：

dataframes = [pd.read_csv(f,skiprows=4) for f in filesnames]

Answer 3

它不起作用

我需要将第一个信息放在一列中（第一行没有索引），第二行（索引0）将被删除，而de index 1将是de header。

[墨西哥气象博物馆：瓜拉提巴 0 Dados normalizados para oHorárioBrasileiro d ... 1 Dia Hora HBV Chuva DirVento V ... 2（粗粒）...

如何通过熊猫跳过多次加载中的某些行

3 个答案: