我有以下格式的CSV文件:
index A B C
ind1 [1,2,3][3,4,5][6,7,8]
ind2 [1,4,3,4,8][9,1,2,1,4][3,7,3,5,9]
ind3 [2,8][1,8][1,5]
每个单元格(例如A,ind1)都有一个列表[1,2,3]。 当我将其导入数据框时:
df=pd.read_csv('filename.csv')
我得到的格式与csv相同的数据框,但是单个单元格中的列表作为字符串导入。
说我索引ind1列A的第一个元素
df.iloc[0]['A']
给了我'['
而不是1
基本上,它是将[1,2,3]
读为一个长字符串,而不是将其读为列表。
如何将所有单元格中的值转换为列表?
答案 0 :(得分:2)
有趣的问题。如果您要使用熊猫,我会首先使用literal_eval对该列表进行编码。
import pandas as pd
from ast import literal_eval
df = pd.read_csv("filename.csv")
比起您可以使用pandas applymap来将literal_eval函数应用于每个单元格
。df[['A', 'B', 'C']] = df[['A', 'B', 'C']].applymap(literal_eval)
现在,您已经提取了列表,并且可以像普通列表一样对它们做出反应。 例如这将从第一个列表中为您提供第一个元素:
df.iloc[0]['A'][0]
希望对您有帮助