列长度​​不同的熊猫的read_csv

时间:2020-01-20 11:48:58

标签: python pandas csv

我正在尝试使用python中的pandas lib读取csv文件,但是我遇到了问题... 我的CSV文件是“传感器读取器”,并且可以更改列长(有时为147,有时为148,并且这也发生在文件的中间)。除此之外,我的csv文件的前4行有垃圾信息,我必须跳过。 我的问题是:由于我需要跳过初始行,并且即使列长大于初始列长,也要读最后几行,所以如何读取此文件?

jump_initial_lines_length = 4

data = pd.read_csv(ARQUIVO, keep_default_na=False, skiprows=4, na_filter=False, header=jump_initial_lines_length)

我有一个csv文件的示例:

0  File name: bananas

1  Date: 12/12/1212

2  Author: Jvff

3  Version: 1.0.3

4  Fruits  Cities  Names  Cars  Colors

5  Apple  NY       Joe    Logan   White

6 Bananas LA       Bob    Renegade  Black

7  Fruits  Cities  Names  Cars  Colors  **Country**

8  Apple  NY       Joe    Logan   White  **EUA**

9 Bananas LA       Bob    Renegade  Black  **Canada**

您可以在第7行看到新的“国家/地区栏” ...

**条件:

〜>“国家/地区”列的行是未知的(我不知道国家/地区列何时在csv文件中开始)

〜>我只是从另一个dpt捕获了csv文件...因此,不可能在csv文件的生产中对其进行过滤**

0 个答案:

没有答案