我有一个csv文件,如下所示:
Question Answer
a A
b NaN
c NaN
d B
e NaN
f NaN
我想要创建一个字典(或json文件),例如:
[{'answer': 'A', 'questions':'a', 'b', 'c'}, {'answer': 'B', 'questions':'d', 'e', 'f'}]
哪种方法最有效?
答案 0 :(得分:0)
我们可以在ffill
之前检查groupby
df.groupby(df.Answer.ffill()).Question.agg(list).reset_index().to_dict('r')
Out[17]:
[{'Answer': 'A', 'Question': ['a', 'b', 'c']},
{'Answer': 'B', 'Question': ['d', 'e', 'f']}]