如何创建熊猫函数以读取不同大小的数据框

时间:2020-03-13 20:43:06

标签: python pandas

我正在尝试自动完成我的工作的里程旅行,这涉及读取.csv文件并使用pandas模块。问题是.csv文件的长度不同,因为每个人的行程都不同。是否有任何功能可以创建一个准确读取行程数的函数,而不管.csv文件的长度如何? .csv文件在我不想读入DataFrame的行下面有一些额外的行。

      a  b  c  
trip1 x  x  x  
trip2 x  x  x 
trip3 x  x  x  
      a  b  c  
trip1 x  x  x  
trip2 x  x  x 
trip3 x  x  x
trip4 x  x  x
      ...
trip9 x  x  x 

2 个答案:

答案 0 :(得分:0)

我假设您想从.csv文件中读取n行,您可以这样做:

pd.read_csv('path_to_file.csv', nrows=10)

这将仅读取csv中的前10行。如果要读取包含大量数据和大小的文件,这将很有帮助。

如果要跳过最后n行,可以执行以下操作:

pd.read_csv('path_to_file.csv', skipfooter=2)

这将始终跳过csv中的最后2行。

文档:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

答案 1 :(得分:0)

如果要打印第一行,请使用df.head()

import pandas as pd

def read():
     df = df.read_csv('csv_file.csv')
     df.head(10) #depends how many rows you want to print.
     print(df)

如果要从底部开始打印,请使用df.tail()

import pandas as pd
def read():
    df = df.read_csv('csv_file.csv')
    df.tail(10) #depends how many rows you want to print.
    print(df)