我使用熊猫加载了1000多个文件,但是在此之前,我必须占用每个文件的前4行。一个怎么办?我尝试跳过,但在下面的这段代码中不起作用
from google.colab import files
uploaded = files.upload()
from glob import glob
import pandas as pd
dataframes = [pd.read_csv(f) for f in filesnames]
dataframes
输出:
[ Relatório Meteorológico da Estação: Guaratiba
0 Dados normalizados para o Horário Brasileiro d...
1 Dia Hora HBV Chuva DirVento V...
2 (graus) ...
3 01/03/2013 00:00:00 0.0 - ...
4 01/03/2013 00:15:00 0.0 - ...
5 01/03/2013 00:30:00 0.0 - ...
6 01/03/2013 00:45:00 0.0 - ...
7 01/03/2013 01:00:00 0.0 - ...
答案 0 :(得分:0)
要跳过前三行,可以使用read_csv的skip_rows参数:
df = pd.read_csv(f, skip_rows=3)
您可以执行以下操作保留所有标题:
df = pd.read_csv(f, skip_rows=1) # Skip the first row, use second row as headers
df.drop(df.head(1).index, inplace=True) # Drop the first row of the dataframe
答案 1 :(得分:0)
请检查以下各项是否有效:
dataframes = [pd.read_csv(f,skiprows=4) for f in filesnames]
答案 2 :(得分:0)
它不起作用
我需要将第一个信息放在一列中(第一行没有索引),第二行(索引0)将被删除,而de index 1将是de header。
[墨西哥气象博物馆:瓜拉提巴 0 Dados normalizados para oHorárioBrasileiro d ... 1 Dia Hora HBV Chuva DirVento V ... 2(粗粒)...