如何使用R或Matlab中的原始数据和查找表创建新表?

时间:2018-11-25 02:27:15

标签: r matlab

我在table1.txt中有原始温度数据,站号标题为

Date       101    102    103    
1/1/2001   25     24     23      
1/2/2001   23     20     15      
1/3/2001   22     21     17      
1/4/2001   21     27     18     
1/5/2001   22     30     19     

我有一个查找表文件lookup.txt,其内容为:

ID  Station
1   101
2   103
3   102
4   101
5   102

现在,我想创建一个具有ID号标题的新表(new.txt),该表应读为

    Date        1      2       3     4     5    
    1/1/2001   25     23      24     25    24
    1/2/2001   23     15      20     23    20
    1/3/2001   22     17      21     22    21
    1/4/2001   21     18      27     21    27
    1/5/2001   22     19      30     22    30

反正我可以在R或Matlab中做到吗?

3 个答案:

答案 0 :(得分:1)

我想出了使用tidyverse的解决方案。它涉及到从宽到长的转换,匹配Station上的数据帧,然后扩展变量。

#Recreating the data

library(tidyverse)

df1 <- read_table("text1.txt")

lookup <- read_table("lookup.txt")

#Create the output
k1 <- df1 %>% 
       gather(Station, value, -Date) %>%
       mutate(Station = as.numeric(Station)) %>%
       inner_join(lookup) %>% select(-Station) %>%
       spread(ID, value)

k1

答案 1 :(得分:1)

我们可以使用base R来做到这一点。通过用第一个数据集的match names {Station}列创建列索引,使用该索引复制'df1'列,然后使用'ID'列更改列名称第二个数据集

i1 <- with(df2, match(Station, names(df1)[-1]))
dfN <- df1[c(1, i1 + 1)]
names(dfN)[-1] <- df2$ID
dfN
#      Date  1  2  3  4  5
#1 1/1/2001 25 23 24 25 24
#2 1/2/2001 23 15 20 23 20
#3 1/3/2001 22 17 21 22 21
#4 1/4/2001 21 18 27 21 27
#5 1/5/2001 22 19 30 22 30

数据

df1 <- structure(list(Date = c("1/1/2001", "1/2/2001", "1/3/2001", "1/4/2001", 
"1/5/2001"), `101` = c(25L, 23L, 22L, 21L, 22L), `102` = c(24L, 
20L, 21L, 27L, 30L), `103` = c(23L, 15L, 17L, 18L, 19L)), 
 class = "data.frame", row.names = c(NA, 
-5L))

df2 <- structure(list(ID = 1:5, Station = c(101L, 103L, 102L, 101L, 
102L)), class = "data.frame", row.names = c(NA, -5L))

答案 2 :(得分:1)

这是MatLab的一个选项:

T = readtable('table1.txt','FileType','text','ReadVariableNames',1);
L = readtable('lookup.txt','FileType','text','ReadVariableNames',1);
old_header = strcat('x',num2str(L.Station));
newT = array2table(zeros(height(T),height(L)+1),...
    'VariableNames',[{'Date'} strcat('x',num2cell(num2str(L.ID)).')]);
newT.Date = T.Date;
for k = 1:size(old_header,1)
    newT{:,k+1} = T.(old_header(k,:));
end
writetable(newT,'new.txt','Delimiter',' ')