我有一列包含以下值:
gene_id
ENSG00000228572.7_PAR_Y_AL954722.1
ENSG00000182378.13_PAR_Y_PLCXD1
ENSG00000223972.5_DDX11L1
ENSG00000243485.5_MIR1302-2HG
我试图在下划线_
的最后一次出现时将它们分开:
library(tidyverse)
expr <- expr %>%
separate(gene_id, c("gene_id", "gene_symbol"), sep = "\\_", extra = "merge") %>%
as.data.frame()
但是,结果是:
gene_id gene_symbol
ENSG00000228572.7 PAR_Y_AL954722.1
ENSG00000182378.13 PAR_Y_PLCXD1
ENSG00000223972.5 DDX11L1
ENSG00000243485.5 MIR1302-2HG
相反,我想区分下划线的最后一次出现,以便_PAR_Y件保留在gene_id列中。