我有一种情况,其中Pandas read_csv正在读取不同计算机上的不同行数。 然而,我已经验证了相同的脚本和正在使用的相同输入文件。
这是脚本:
import pandas as pd
import csv
PACEpath=r"e:\LMT\PACE_Export.csv"
PACEDF = pd.read_csv(PACEpath, quoting=csv.QUOTE_NONE,
error_bad_lines=True,
usecols=["LOCATION_CODE", "PACE_NUMBER"])
print "PACEDF rows: ", PACEDF.shape[0]
问题在于:
计算机#S在数据帧中读取123,889行
计算机#B将123,889行读入数据帧
计算机#M1将102,345行读入数据帧
计算机#M2将102,345行读入数据帧
我检查了各种版本,我看到了这一点:
计算机#S conda = 4.3.8请求= 2.12.4 pandas = 0.19.2 CPython = 3.6.0 Windows = 7
计算机#B conda = 4.3.8请求= 2.12.4 pandas = 0.19.2 CPython = 2.7.13 Windows = 7
计算机#M1 conda = 4.3.24 requests = 2.12.4 pandas = 0.20.1 CPython = 2.7.13 Windows = 7
计算机#M2 conda = 4.3.8请求= 2.12.4 pandas = 0.19.2 CPython = 3.6.0 Windows = 7
我尝试排除read_csv中的参数,例如:
pd.read_csv(PACEpath, usecols=["LOCATION_CODE", "PACE_NUMBER"])
相同的结果。请帮忙。