我有以下每个单词出现频率的Pandas数据框:
resample
表格(打印df):
d = {'Count' : pd.Series([2, 3, 5]), 'Term': pd.Series(['Cool', 'New', 'Very'])}
df = pd.DataFrame(d)
但是,我想将每个单词的字面频率转换为称为“术语”的一列中每个频率的单词列表:
输出看起来像这样:
Count Term
0 2 Cool
1 3 New
2 5 Very
有人可以帮我建立一些可扩展的东西来实现这一目标吗?
答案 0 :(得分:5)
IIUC pandas
repeat
df.Term.repeat(df.Count)
Out[350]:
0 Cool
0 Cool
1 New
1 New
1 New
2 Very
2 Very
2 Very
2 Very
2 Very
Name: Term, dtype: object
答案 1 :(得分:3)
Opacity