我正在尝试自动完成我的工作的里程旅行,这涉及读取.csv文件并使用pandas模块。问题是.csv文件的长度不同,因为每个人的行程都不同。是否有任何功能可以创建一个准确读取行程数的函数,而不管.csv文件的长度如何? .csv文件在我不想读入DataFrame的行下面有一些额外的行。
a b c
trip1 x x x
trip2 x x x
trip3 x x x
a b c
trip1 x x x
trip2 x x x
trip3 x x x
trip4 x x x
...
trip9 x x x
答案 0 :(得分:0)
我假设您想从.csv文件中读取n行,您可以这样做:
pd.read_csv('path_to_file.csv', nrows=10)
这将仅读取csv中的前10行。如果要读取包含大量数据和大小的文件,这将很有帮助。
如果要跳过最后n行,可以执行以下操作:
pd.read_csv('path_to_file.csv', skipfooter=2)
这将始终跳过csv中的最后2行。
文档:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
答案 1 :(得分:0)
如果要打印第一行,请使用df.head()
import pandas as pd
def read():
df = df.read_csv('csv_file.csv')
df.head(10) #depends how many rows you want to print.
print(df)
如果要从底部开始打印,请使用df.tail()
import pandas as pd
def read():
df = df.read_csv('csv_file.csv')
df.tail(10) #depends how many rows you want to print.
print(df)