我有一个包含纬度,经度和承印物类型的横断面数据。下面,我提供了一个脚本,该脚本沿着经度-24.5开始至-23.2。的直线样线创建具有3种基底类型的假设数据。在该样条中,存在3种基材类型(a,b和c),但是基材类型“ a”出现4次,基材类型“ b”出现2次。我想计算断面中每个“ a”,“ b”和“ c”基片类型片段的总长度(米)。作为示例,衬底段“ a”在“ b”衬底类型的第一观察位置处终止,并且衬底段c在第四“ a”衬底类型段开始的位置处终止。我想要的长度。我已经研究过sp和Rdistance软件包,但是我真的很困惑。在此先感谢。
假设示例:每个方框表示我要为其计算长度的每个段
Alon<-c(-23.20, -23.30,-23.40,-24.10,-24.15, -23.95, -23.70, -23.60,- 24.20, -24.25)
Blon<-c(-23.80, -23.85, -24.00, -24.03, -24.06)
Clon<-c(-23.47, -23.50,-23.55)
Alat<-c(64,64,64,64,64, 64, 64, 64,64, 64)
Blat<-c(64,64, 64, 64,64)
Clat<-c(64,64, 64)
A<-as.data.frame(cbind(Alon, Alat))
B<-as.data.frame(cbind(Blon, Blat))
C<-as.data.frame(cbind(Clon, Clat))
plot(A$Alon, A$Alat, pch=97)
points(B$Blon, B$Blat, col="red", pch=98)
points(C$Clon, C$Clat, col="blue", pch=99)
A$ID<-seq.int(nrow(A))
A[,3]<-"A"
B$ID<-seq.int(nrow(B))
B[,3]<-"B"
C$ID<-seq.int(nrow(C))
C[,3]<-"C"
colnames(A)<-c("lon", "lat", "ID")
colnames(B)<-c("lon", "lat", "ID")
colnames(C)<-c("lon", "lat", "ID")
A<-as.data.frame(A)
B<-as.data.frame(B)
C<-as.data.frame(C)
pos<- rbind(A,B,C)
pos<-pos[,c("ID","lon","lat")]
答案 0 :(得分:1)
我怀疑以米为单位的长度取决于您的投影,因此在这里我以度为单位计算长度,并将转换留给您。首先,我按经度排序(因为您的纬度都相同)。
# Order data frame
pos <- pos[order(pos$lon),]
接下来,我使用rle
提取每个ID
的运行。我添加1以在第一个元素上开始第一次运行,并使用pmin
确保最终索引不大于数据框中的行数。
# Pull out start and end points of segments
df_seg <- pos[pmin(nrow(pos), c(1, cumsum(rle(pos$ID)$lengths) + 1)),]
最后,我使用diff
来计算每次运行的开始和结束经度之间的差。
# Calculate difference in longitude
data.frame(ID = df_seg$ID[1:(nrow(df_seg)-1)], diff_lon = abs(diff(df_seg$lon)))
# Check data frame
# ID diff_lon
# 1 A 0.19
# 2 B 0.11
# 3 A 0.10
# 4 B 0.15
# 5 A 0.15
# 6 C 0.15
# 7 A 0.20
我希望对此有一个好的解决方案,但我没有。所以,我会在做一些可怕的事情之前道歉...
library(dplyr)
library(RANN)
# Temporary data frame
df_stations <- pos
# Function for finding order of stations
station_order <- function(){
# If only one row, return it (i.e., it's the final station)
if(nrow(df_stations) == 1)return(df_station)
# Find the nearest neighbour for the first station
r <- nn2(data = df_stations %>% select(lon, lat), k = 2)$nn.idx[1,2]
# Bump the nearest neighbour to first in the data frame
# This also deletes the first entry
df_stations[1, ] <<- df_stations[r, ]
# Drop the nearest neighbour elsewhere in the data frame
df_stations <<- df_stations %>% distinct
# Return the nearest neighbour
return(df_stations[1, ])
}
# Initialise data frame
res <- df_stations[1,]
# Loop over data frame
for(i in 2:nrow(df_stations))res[i, ] <- station_order()
此代码使用最近的邻居(即nn2
中的RANN
)对您的电台进行排序。您会注意到该样条线是倒置的,但是您随时可以使用res[nrow(res):1, ]
进行更改。
# ID lon lat
# 1 A -23.20 64
# 2 A -23.30 64
# 3 A -23.40 64
# 4 C -23.47 64
# 5 C -23.50 64
# 6 C -23.55 64
# 7 A -23.60 64
# 8 A -23.70 64
# 9 B -23.80 64
# 10 B -23.85 64
# 11 A -23.95 64
# 12 B -24.00 64
# 13 B -24.03 64
# 14 B -24.06 64
# 15 A -24.10 64
# 16 A -24.15 64
# 17 A -24.20 64
# 18 A -24.25 64