我正在尝试从公共数据集中读取数据 https://www.kaggle.com/cityofLA/los-angeles-parking-citations#parking-citations.csv
我的命令:
parking_data=pd.read_csv("/datasets/parking-citations.csv",delimiter=',',dtype={'Issue Date' : str, 'Issue time':str, 'Marked Time': str, 'Plate Expiry Date':str})
并且当我尝试将数据读入pandas daffarame时,仅当我进行“标记时间”时才收到以下警告:dtype中的str。
警告
DtypeWarning: Columns (0,7) have mixed types. Specify dtype option on import or set low_memory=False.
有人可以给我我得到它的理由吗?
看起来Marked Time
具有一些NaN
值,但是在dtype中给出的其他一些列也是如此。
答案 0 :(得分:0)
您的警告来自第0列(“票号”)和第7列(“ VIN”)
df = pd.read_csv('parking-citations.csv', dtype={'Ticket number':str, 'VIN':str})
因此,指定这些列的类型可以解决此问题。