Question

它最初被标记为重复项（可以理解）。但是，我不是在寻找单词共现矩阵。相反，我需要一个频率表行x字。

在这种情况下，我不是要寻找单词共现矩阵。

我需要找到一种自动方法来提取原始矢量，然后根据其内容将其转换为三个单独的矢量。

OriginalVector <- c("The nimble red fox", "Lazy Grey Dog", "Red Fox funny")

我需要找到一种自动方法来提取原始矢量，然后根据其内容将其转换为三个单独的矢量。

Nimble Red    Fox    Lazy   Grey   Dog    funny
1      1      1      0      0      0      0
0      0      0      1      1      1      0
0      1      1      0      0      0      1

每行应代表原始向量中的相应条目。也就是说，第一行反映了第一个观测值“敏捷的红狐狸”的计数，第二行反映了“懒惰的灰狗”的计数，第三行反映了“红狐狸很有趣”的计数。

我的现实世界问题在原始向量中还有更多条目，在创建新向量时还有更多标准。他们是自动解决此问题的方法吗？

我可以使用以下方法检测单个子字符串：

unique(word(OriginalVector)

答案的另一部分可能在这里：（How to create a list of multiple vectors with **names** and **paste** in R）：

unif <- list()

for(3 in 1:3){unif[[3]] <- runif(20)} 
names(unif) <- paste0("vect", 1:3)

但是我如何有组织地加载结果数据（0和1）？

基于多个字符串向量创建新向量

0 个答案: