error_bad_lines = False不会删除带有额外列的行

时间:2017-07-24 12:59:31

标签: python pandas csv

我有一个用pandas处理的csv文件。我有以下列:

df.columns = ["id", "ocr", "raw_value", "manual_raw_value"]

但是,我有一些行超过五列。例如:

id             ocr       raw_value      manual_raw_value
2d704f42    OMNIPAGE    remuneration      rémunération       hello
bfa6c9f14   OMNIPAGE    35470              35470
213e1e1e    OMNIPAGE    Echeance          Echéance

我做了以下操作,以便不读取带有额外列的行(如第一行)

df = pd.read_csv(filename, sep=",",index_col=None, error_bad_lines=False)

但是保留了包含额外列的行。

谢谢

1 个答案:

答案 0 :(得分:1)

另一个尝试。为了便于索引,我会重命名列,甚至是那些不必要的列:

if ( p1ScoreCount === inputScore.value) {
    p1Span.classList.add("green");
    gameOver = true;
    alert("Player 1 Wins!");
} 

else if ( p2ScoreCount === inputScore.value) {
    p2Span.classList.add("green");
    gameOver = true;
    alert("Player 2 Wins!");
}

if (gameOver === true) {
       p1Button.disabled = true;
       p2Button.disabled = true;
    }

我假设,空位是NaN,因此有效行将在其他列中包含所有NaN。我没有成功地搜索特定的函数,因此我会通过单列进行交互,只留下那些使用NaN并只选择需要的列:

df.columns = range(0, df.shape[1])

然后将它们重命名为您想要的。希望这会有所帮助。