我正在使用Python中的applymap将特定的关键字与文本数据映射。假设我要检查关键字“ hello”与所有行上的文本数据匹配的频率。 Applymap为我提供了所需的矩阵结果,但是只有“ True”或“ False”,而不是出现次数。
我试图将count()与我的applymap函数连接起来,但是我无法使其工作。
最小的工作示例如下:
import pandas as pd
import numpy as np
df = pd.DataFrame({'text': ['hello hello', 'yes no hello', 'good morning']})
keys = ['hello']
keyword = pd.DataFrame({0:keys})
res = []
for a in df['text']:
res.append(keyword.applymap(lambda x: x in a))
map = pd.concat(res, axis=1).T
map.index = np.arange(len(map))
#Output
map
0
0 True
1 True
2 False
#Desired Output with 'hello' appearing twice in the first row, once in the second and zero in the third of df.
0
0 2
1 1
2 0
我正在寻找一种方法来保留我的applymap函数以获取矩阵形式,但将True(1)和False(0)替换为外观数量,例如上面显示的所需输出。
答案 0 :(得分:1)
代替测试列表中的项目:
res.append(keyword.applymap(lambda x: x in a))
#x == a
您应该使用:
res.append(keyword.applymap(lambda x: str.count(a, x)))
#计算“ a”的出现