我知道我的问题很简单,但是我整个上午都在努力,无法解决这个问题。
我有这个数据框:
GeneID Gene.Symbol01 Ratio.2h Ratio.6h Ratio.10h Ratio.24h Pvalue_2h
1 174 FUT -0.23618761 -0.3276162 -0.1366940 -4.4899131 0.49045105
Pvalue_6h Pvalue_10h Pvalue_24h
1 0.06128851 0.59995612 0.0001798584
我需要把除GeneID和GeneSymbol之外的所有列都改用支点。结果数据框应具有3个新列。一个时间:2h,6h,10h和24h。然后再增加两列具有比率值的列,另一列具有pvalues。
我知道应该使用names_to和names_pattern的组合来完成。 我已经尝试了很多东西,但我做不到。
我最后尝试过的是:
pivot_longer(cols = -c(GeneID, Gene.Symbol01),
names_to = c("Time", ".value"),
names_pattern = "_")
投放:
structure(list(GeneID = 174, Gene.Symbol01 = "FUT", Ratio.2h = -0.23618761,
Ratio.6h = -0.3276162, Ratio.10h = -0.136694, Ratio.24h = -4.4899131,
Pvalue_2h = 0.49045105, Pvalue_6h = 0.06128851, Pvalue_10h = 0.59995612,
Pvalue_24h = 0.0001798584), row.names = c(NA, -1L), class = c("tbl_df",
"tbl", "data.frame"))
答案 0 :(得分:2)
您可能希望使用tidyverse
pivot_longer
的所有变量从Ratio.2h
到Pvalue_24h
,然后separate
分成2列。
library(tidyverse)
DF %>%
pivot_longer(Ratio.2h:Pvalue_24h, names_to = "var") %>%
separate(var, into = c("type", "time"), sep = "_|\\.")
# # A tibble: 8 x 5
# GeneID Gene.Symbol01 type time value
# <dbl> <chr> <chr> <chr> <dbl>
# 1 174 FUT Ratio 2h -0.236
# 2 174 FUT Ratio 6h -0.328
# 3 174 FUT Ratio 10h -0.137
# 4 174 FUT Ratio 24h -4.49
# 5 174 FUT Pvalue 2h 0.490
# 6 174 FUT Pvalue 6h 0.0613
# 7 174 FUT Pvalue 10h 0.600
# 8 174 FUT Pvalue 24h 0.000180
然后,使用pivot_wider
DF %>%
pivot_longer(Ratio.2h:Pvalue_24h, names_to = "var") %>%
separate(var, into = c("type", "time"), sep = "_|\\.") %>%
pivot_wider(names_from = "type", values_from = "value")
# # A tibble: 4 x 5
# GeneID Gene.Symbol01 time Ratio Pvalue
# <dbl> <chr> <chr> <dbl> <dbl>
# 1 174 FUT 2h -0.236 0.490
# 2 174 FUT 6h -0.328 0.0613
# 3 174 FUT 10h -0.137 0.600
# 4 174 FUT 24h -4.49 0.000180
数据
DF <- tribble(~GeneID, ~Gene.Symbol01, ~Ratio.2h, ~Ratio.6h, ~Ratio.10h, ~Ratio.24h, ~Pvalue_2h,~Pvalue_6h, ~Pvalue_10h, ~Pvalue_24h,
174, "FUT", -0.23618761, -0.3276162, -0.1366940, -4.4899131, 0.49045105,0.06128851, 0.59995612, 0.0001798584)
答案 1 :(得分:0)
使用融化:
library(data.table)
melt(df,id.vars=1:2) %>% separate(variable,c("type","time"))) %>%
pivot_wider(names_from =type,values_from= value)
结果:
#
# GeneID Gene.Symbol01 time Ratio Pvalue
# <dbl> <fct> <chr> <dbl> <dbl>
#1 174 FUT 2h -0.236 0.490
#2 174 FUT 6h -0.328 0.0613
#3 174 FUT 10h -0.137 0.600
#4 174 FUT 24h -4.49 0.000180