它最初被标记为重复项(可以理解)。但是,我不是在寻找单词共现矩阵。相反,我需要一个频率表行x字。
在这种情况下,我不是要寻找单词共现矩阵。
我需要找到一种自动方法来提取原始矢量,然后根据其内容将其转换为三个单独的矢量。
OriginalVector <- c("The nimble red fox", "Lazy Grey Dog", "Red Fox funny")
我需要找到一种自动方法来提取原始矢量,然后根据其内容将其转换为三个单独的矢量。
Nimble Red Fox Lazy Grey Dog funny
1 1 1 0 0 0 0
0 0 0 1 1 1 0
0 1 1 0 0 0 1
每行应代表原始向量中的相应条目。也就是说,第一行反映了第一个观测值“敏捷的红狐狸”的计数,第二行反映了“懒惰的灰狗”的计数,第三行反映了“红狐狸很有趣”的计数。
我的现实世界问题在原始向量中还有更多条目,在创建新向量时还有更多标准。他们是自动解决此问题的方法吗?
我可以使用以下方法检测单个子字符串:
unique(word(OriginalVector)
答案的另一部分可能在这里:(How to create a list of multiple vectors with **names** and **paste** in R):
unif <- list()
for(3 in 1:3){unif[[3]] <- runif(20)}
names(unif) <- paste0("vect", 1:3)
但是我如何有组织地加载结果数据(0和1)?