我有一个包含国家及其宪法的数据集。我想知道是否有一种方法可以创建一个变量,以显示“上帝”一词在宪法变量中显示了多少次。
数据集如下:
Country Year Preamble
Afghanistan 2004 In the name of Allah...
Albania 1998 We, the people of Albania...
... .... .......
,依此类推。我特别想知道是否有一个函数可以计算一个类别变量中某个特定单词的使用次数,或者是否有更好的方法来完成我要尝试的工作。
答案 0 :(得分:1)
假设您要计算“ Al”出现在上述数据集中的次数,则可以使用grep像这样:
仅一列:
grep("Al", data$Preamble)
对于所有列:
lapply(data, function(x) grep("Al", x))
$`Country`
[1] 2
$Year
integer(0)
$Preamble
[1] 1 2
这将告诉您在哪个行和列中找到匹配项,即在“国家”列中找到一个,在“前言”列中找到两个