pandas数据帧列中的单元格是单独的列表。 dtype列表不起作用

时间:2016-04-20 10:20:08

标签: python csv pandas dataframe

dtype_dict = {'_id':str, 'userId':str, 'ownName':str, 'created_time':str, 'created_by':str,
   'addressInputList':list, 'displayName':str, 'emailInputList':list,
   'groupInputList':list, 'imInputList':list, 'lastContactedTime':int,
   'lastUpdatedTime':int, 'noOfTimesContacted':int, 'notes':str, 'orgInputList':list,
   'phoneNumberInputList':list, 'relationInputList':list, 'id':str,
   'inputTakenTime':str}
contacts = pd.read_csv("All-Fri Apr 15 2016 13_45_57 GMT+0530 (IST).csv", dtype=dtype_dict)
print contacts.dtypes
print contacts["phoneNumberInputList"][1]

我得到的输出是:

enter image description here

我检查了csv文件的每一行,但该csv文件中的格式是统一的。该列(phoneNumberInputList)是所有行中的正确列表。请指出我在哪里做错了以及如何将该列(以及其他类似的)列作为dtype list。

1 个答案:

答案 0 :(得分:0)

嗯,这不是正确的方法,但我找到了一个黑客。使用graphlab sframe以dtype作为列表读取列,然后使用.to_dataframe命令将该sframe转换为dataframe。