我在每行中都有一系列collection.counter对象。像这样:
0 {'PRP$': 1, 'NNS': 1, 'VBP': 1, 'DT': 3, 'NN':...
1 {'JJS': 1, 'NN': 4, 'IN': 1, 'JJ': 1}
2 {'DT': 2, 'NNS': 3, 'VBD': 1, 'TO': 1, 'VB': 1...
3 {'CD': 2, 'NNS': 3, 'JJ': 1, 'NN': 2, 'IN': 1}
4 {'RB': 1, 'VBN': 1, 'VBD': 1, 'DT': 2, 'NN': 4...
...
7602 {'DT': 2, 'NN': 4, 'RB': 2, 'VBD': 1, 'CC': 1,...
7603 {'NNS': 2, 'VBP': 1, 'DT': 3, 'NN': 6, 'VBZ': ...
7604 {'NNS': 5, 'VBN': 2, 'IN': 1, 'NN': 4, 'JJ': 1...
7605 {'IN': 4, 'DT': 2, 'JJ': 2, 'NN': 5, 'VBP': 2,...
7606 {'JJ': 2, 'NN': 8, 'NNS': 2, 'CD': 1, 'IN': 2}
我想在我的pandas数据框中创建类似以下内容的新列:
re-arranged_data = {'PRP$':[1,2,3...1,0],
'NN':[1,1,1,0,...1],
'DT':[0,0,0,0,1000],
...
}
我不知道如何执行此步骤,也不知道如何将re-arranged_data添加为新列。
有帮助吗?
答案 0 :(得分:4)
使用df.from_records()
。
示例代码在这里。
import pandas as pd
from collections import Counter
a = Counter({'PRP$':1, 'NNS':1})
b = Counter({'JJS':2, 'NNS': 3})
A = pd.Series([a, b])
pd.DataFrame.from_records(A, columns = A.sum().keys())
答案 1 :(得分:1)
您实际上可以将其附加到数据框中 将熊猫作为pd导入 导入收藏集
dataframe = pd.DataFrame(columns = [“ PRP”,“ NN” ....]) dataframe.append(collection.counter)