有几种方法可以获得pandas数据帧的行数。
我的问题是;我可以通过简单地知道文件的行数来获得实际的行数吗?如果没有,我可以找到行计数的一种方法,而不必加载数据帧?
在这种情况下,我能够将行数和行数统计为相同。
...
s1 = len(df.index) # get the row count.
with open(filename) as f: # open a file and count the lines, actual line count is 6377
for i, l in enumerate(f):
pass
s2 = i + 1 # row count
s2 = s2 - 2 # line count -2
输出:
s1 = {int} 6375
s2 = {int} 6375
答案 0 :(得分:1)
不一定。例如,文件可能有标题,在这种情况下,它将比数据框多一行。根据从文件中读取数据框的方式,还有其他方法可以使Pandas忽略文件中的行(例如,您可以忽略注释行)。