我有大数据集,基本上是多个文件附加在一起。数据文件有许多标题行。除了第1行中的标题行,我想跳过所有标题行,只是从数据文件中读取数据。
我怎么能在python中做到这一点?一个简单的例子会很棒。
感谢。
答案 0 :(得分:1)
如果你知道标题行的样子(你听起来像这样),你可以通过忽略它来直接在for循环中传递它。
myfile = open("data.txt")
header = next(myfile) # assume the first line is header
for line in myfile:
if line == header: continue
# process non-header line