我正在尝试使用python中的pandas lib读取csv文件,但是我遇到了问题... 我的CSV文件是“传感器读取器”,并且可以更改列长(有时为147,有时为148,并且这也发生在文件的中间)。除此之外,我的csv文件的前4行有垃圾信息,我必须跳过。 我的问题是:由于我需要跳过初始行,并且即使列长大于初始列长,也要读最后几行,所以如何读取此文件?
jump_initial_lines_length = 4
data = pd.read_csv(ARQUIVO, keep_default_na=False, skiprows=4, na_filter=False, header=jump_initial_lines_length)
我有一个csv文件的示例:
0 File name: bananas
1 Date: 12/12/1212
2 Author: Jvff
3 Version: 1.0.3
4 Fruits Cities Names Cars Colors
5 Apple NY Joe Logan White
6 Bananas LA Bob Renegade Black
7 Fruits Cities Names Cars Colors **Country**
8 Apple NY Joe Logan White **EUA**
9 Bananas LA Bob Renegade Black **Canada**
您可以在第7行看到新的“国家/地区栏” ...
**条件:
〜>“国家/地区”列的行是未知的(我不知道国家/地区列何时在csv文件中开始)
〜>我只是从另一个dpt捕获了csv文件...因此,不可能在csv文件的生产中对其进行过滤**