我正在尝试处理一个文件,该文件的数据用逗号(,)分隔,但是某些行的末尾有ASCII字符,另外还有逗号(,)。这导致我的脚本崩溃
为了解决这个问题,我将error_bad_lines设置为False,但是这导致这些行被跳过。
有没有一种方便的方式可以读取整个文件而不留下任何一行?
我不想逐行替换'&“读取文件,然后重新使用熊猫对其进行操作
Python 3.6.5
pd.read_csv(file_Name,sep =',',error_bad_lines = False,encoding ='iso-8859-1',engine ='python')
行:
1 * 1,2,3,4,5,6,7,8,9 ^ Q“ ^ N 1 * 1,2,3,4,5,6,7,8,9 ^ R“ ^ N 1,2,3,4,5,6,7,8,9 ^ S“ ^ N 1,2,3,4,5,6,7,8,9 ^ T“ ^ N 1,2,3,4,5,6,7,8,9 ^ U“ ^ N 1,2,3,4,5,6,7,8,9 ^ V“ ^ N 1,2,3,4,5,6,7,8,9 ^ W“ ^ N
encoding ='iso-8859-1'处理第一个字段中的*,但末尾的^ K等符将其破坏
跳过第1行:“,”应在“””之后
1,2,3,4,5,6,7,8,9,
跳过第2行:预计第2行中有9个字段,看到10个
请告知