应用错误收集

我正在尝试处理一个文件，该文件的数据用逗号（，）分隔，但是某些行的末尾有ASCII字符，另外还有逗号（，）。这导致我的脚本崩溃

为了解决这个问题，我将error_bad_lines设置为False，但是这导致这些行被跳过。

有没有一种方便的方式可以读取整个文件而不留下任何一行？

我不想逐行替换'＆“读取文件，然后重新使用熊猫对其进行操作

Python 3.6.5

pd.read_csv（file_Name，sep ='，'，error_bad_lines = False，encoding ='iso-8859-1'，engine ='python'）

行：

1 * 1,2,3,4,5,6,7,8,9 ^ Q“ ^ N 1 * 1,2,3,4,5,6,7,8,9 ^ R“ ^ N 1,2,3,4,5,6,7,8,9 ^ S“ ^ N 1,2,3,4,5,6,7,8,9 ^ T“ ^ N 1,2,3,4,5,6,7,8,9 ^ U“ ^ N 1,2,3,4,5,6,7,8,9 ^ V“ ^ N 1,2,3,4,5,6,7,8,9 ^ W“ ^ N

encoding ='iso-8859-1'处理第一个字段中的*，但末尾的^ K等符将其破坏

跳过第1行：“，”应在“””之后

1,2,3,4,5,6,7,8,9，

跳过第2行：预计第2行中有9个字段，看到10个

请告知

如果文件具有'或ASCII字符，则pandas.read_csv错误

0 个答案: