基于多个字符串向量创建新向量

时间:2019-10-30 21:02:41

标签: r string vector

它最初被标记为重复项(可以理解)。但是,我不是在寻找单词共现矩阵。相反,我需要一个频率表行x字。

在这种情况下,我不是要寻找单词共现矩阵。

我需要找到一种自动方法来提取原始矢量,然后根据其内容将其转换为三个单独的矢量。

OriginalVector <- c("The nimble red fox", "Lazy Grey Dog", "Red Fox funny")

我需要找到一种自动方法来提取原始矢量,然后根据其内容将其转换为三个单独的矢量。

Nimble Red    Fox    Lazy   Grey   Dog    funny
1      1      1      0      0      0      0
0      0      0      1      1      1      0
0      1      1      0      0      0      1

每行应代表原始向量中的相应条目。也就是说,第一行反映了第一个观测值“敏捷的红狐狸”的计数,第二行反映了“懒惰的灰狗”的计数,第三行反映了“红狐狸很有趣”的计数。

我的现实世界问题在原始向量中还有更多条目,在创建新向量时还有更多标准。他们是自动解决此问题的方法吗?

我可以使用以下方法检测单个子字符串:

unique(word(OriginalVector)

答案的另一部分可能在这里:(How to create a list of multiple vectors with **names** and **paste** in R):

unif <- list()

for(3 in 1:3){unif[[3]] <- runif(20)} 
names(unif) <- paste0("vect", 1:3)

但是我如何有组织地加载结果数据(0和1)?

0 个答案:

没有答案