我有一个用pandas处理的csv文件。我有以下列:
df.columns = ["id", "ocr", "raw_value", "manual_raw_value"]
但是,我有一些行超过五列。例如:
id ocr raw_value manual_raw_value
2d704f42 OMNIPAGE remuneration rémunération hello
bfa6c9f14 OMNIPAGE 35470 35470
213e1e1e OMNIPAGE Echeance Echéance
我做了以下操作,以便不读取带有额外列的行(如第一行)
df = pd.read_csv(filename, sep=",",index_col=None, error_bad_lines=False)
但是保留了包含额外列的行。
谢谢
答案 0 :(得分:1)
另一个尝试。为了便于索引,我会重命名列,甚至是那些不必要的列:
if ( p1ScoreCount === inputScore.value) {
p1Span.classList.add("green");
gameOver = true;
alert("Player 1 Wins!");
}
else if ( p2ScoreCount === inputScore.value) {
p2Span.classList.add("green");
gameOver = true;
alert("Player 2 Wins!");
}
if (gameOver === true) {
p1Button.disabled = true;
p2Button.disabled = true;
}
我假设,空位是NaN,因此有效行将在其他列中包含所有NaN。我没有成功地搜索特定的函数,因此我会通过单列进行交互,只留下那些使用NaN并只选择需要的列:
df.columns = range(0, df.shape[1])
然后将它们重命名为您想要的。希望这会有所帮助。