Question

我有一个用pandas处理的csv文件。我有以下列：

df.columns = ["id", "ocr", "raw_value", "manual_raw_value"]

但是，我有一些行超过五列。例如：

id             ocr       raw_value      manual_raw_value
2d704f42    OMNIPAGE    remuneration      rémunération       hello
bfa6c9f14   OMNIPAGE    35470              35470
213e1e1e    OMNIPAGE    Echeance          Echéance

我做了以下操作，以便不读取带有额外列的行（如第一行）

df = pd.read_csv(filename, sep=",",index_col=None, error_bad_lines=False)

但是保留了包含额外列的行。

谢谢

Answer 1

另一个尝试。为了便于索引，我会重命名列，甚至是那些不必要的列：

if ( p1ScoreCount === inputScore.value) {
    p1Span.classList.add("green");
    gameOver = true;
    alert("Player 1 Wins!");
} 

else if ( p2ScoreCount === inputScore.value) {
    p2Span.classList.add("green");
    gameOver = true;
    alert("Player 2 Wins!");
}

if (gameOver === true) {
       p1Button.disabled = true;
       p2Button.disabled = true;
    }

我假设，空位是NaN，因此有效行将在其他列中包含所有NaN。我没有成功地搜索特定的函数，因此我会通过单列进行交互，只留下那些使用NaN并只选择需要的列：

df.columns = range(0, df.shape[1])

然后将它们重命名为您想要的。希望这会有所帮助。

error_bad_lines = False不会删除带有额外列的行

1 个答案: