假设一个包含如下置信区间的向量
confint <- c("[0.741 ; 2.233]", "[263.917 ; 402.154]", "[12.788 ; 17.975]", "[0.680 ; 2.450]", "[0.650 ; 1.827]", "[0.719 ; 2.190]")
我希望有两个新矢量,其中一个包含数字格式的下限
lower <- c(0.741, 263.917, 12.788, 0.680, 0.650 , 0.719)
包括其他上限,例如数字格式
upper <- c(2.233, 402.154, 17.975, 2.450, 1.827, 2.190)
答案 0 :(得分:11)
基本的R解决方案
lower = as.numeric(sub(".*?(\\d+\\.\\d+).*", "\\1", confint))
upper = as.numeric(sub(".*\\b(\\d+\\.\\d+).*", "\\1", confint))
lower
[1] 0.741 263.917 12.788 0.680 0.650 0.719
upper
[1] 2.233 402.154 17.975 2.450 1.827 2.190
答案 1 :(得分:2)
mypattern <- '\\[(\\d+\\.\\d+) ; (\\d+\\.\\d+)\\]'
as.numeric(gsub(mypattern, '\\1', confint))
as.numeric(gsub(mypattern, '\\2', confint))
答案 2 :(得分:1)
另一种base R
可能性是:
sapply(strsplit(confint, " ; ", fixed = TRUE), function(x) gsub("[^0-9.-]+", "\\1", x) [1])
sapply(strsplit(confint, " ; ", fixed = TRUE), function(x) gsub("[^0-9.-]+", "\\1", x) [2])
[1] "0.741" "263.917" "12.788" "0.680" "0.650" "0.719"
[1] "2.233" "402.154" "17.975" "2.450" "1.827" "2.190"
如果需要将其用作数字矢量:
sapply(strsplit(confint, " ; ", fixed = TRUE), function(x) as.numeric(gsub("[^0-9.-]+", "\\1", x)) [1])
sapply(strsplit(confint, " ; ", fixed = TRUE), function(x) as.numeric(gsub("[^0-9.-]+", "\\1", x)) [2])
答案 3 :(得分:1)
同时,我想出了另一个base R
解决方案
lower <- as.numeric(sub(".]*", "", sub(";.*", "", confint)))
upper <- as.numeric(sub("].*", "", sub(".*;", "", confint)))
lower
[1] 0.741 263.917 12.788 0.680 0.650 0.719
upper
[1] 2.233 402.154 17.975 2.450 1.827 2.190
谢谢大家!
答案 4 :(得分:0)
您可以使用 stringr 库中的功能。
您可以根据特定字符(在您的情况下为str_split()
)用;
分割字符串,然后用str_remove()
(在[
和]
中删除字符您的案例),您将获得想要的东西。
str_remove(str_split_fixed(confint, ";", n = 2)[,1], '\\[') %>% as.numeric()
# [1] 0.741 263.917 12.788 0.680 0.650 0.719
答案 5 :(得分:0)
一种tidyverse
解决方案:
library(dplyr)
library(tidyr)
df = data.frame(confint)
df = df %>%
mutate(confint = gsub("(\\[|\\])","",confint)) %>%
separate(confint,c("lower","upper"),";",convert=T)