我试图基于查找值将值分别分配给不同的列,分别针对每一行。我正在R中工作。这是一个最小的工作示例:
"return $$('.well').get(0).all(by.tagName('td')).get(0).getText();"
我有很多参与者(即行)接受了许多项目(即列)的评分评估。我想在数据框中为与项目得分相关的值创建变量(基于查找表)。这是我想要的输出:
#Item scores
item1 <- c(NA, 1, NA, 4)
item2 <- c(NA, 2, NA, 3)
item3 <- c(NA, 3, NA, NA)
item57 <- c(NA, 4, 4, 1)
mydata <- data.frame(item1, item2, item3, item57)
#Lookup values based on item score
lookup <- data.frame(score = 1:4, value=c(6, 7, 8, 10))
我有一个相当大的数据集,如果可能的话,我希望远离循环。此外,如果处理速度更快,我们可以跳过所有NA的行。
答案 0 :(得分:1)
这是一个整理方法。它的基础是您要首先gather
得分列和left_join
查找表,以便您的值与得分匹配。然后剩下的就是操纵,以返回到所需的输出格式。为此,我们需要使用gather
和unite
创建所需的列名,然后最后退回spread
。请注意,您一开始需要rowid_to_column
,以便spread
知道将哪些观察值放置在哪些行上。如果您想确切获得输出列名称,可以混入一些stringr
。
item1 <- c(NA, 1, NA, 4)
item2 <- c(NA, 2, NA, 3)
item3 <- c(NA, 3, NA, NA)
item57 <- c(NA, 4, 4, 1)
mydata <- data.frame(item1, item2, item3, item57)
#Lookup values based on item score
lookup <- data.frame(score = 1:4, value=c(6, 7, 8, 10))
library(tidyverse)
mydata %>%
rowid_to_column(var = "participant") %>%
gather(items, score, starts_with("item")) %>%
left_join(lookup) %>%
gather(coltype, val, score:value) %>%
unite(colname, coltype, items) %>%
spread(colname, val)
#> Joining, by = "score"
#> participant score_item1 score_item2 score_item3 score_item57 value_item1
#> 1 1 NA NA NA NA NA
#> 2 2 1 2 3 4 6
#> 3 3 NA NA NA 4 NA
#> 4 4 4 3 NA 1 10
#> value_item2 value_item3 value_item57
#> 1 NA NA NA
#> 2 7 8 10
#> 3 NA NA 10
#> 4 8 NA 6
由reprex package(v0.2.0)于2018-06-19创建。