我的医院病房数据需要保持一致。第一个数字字符是楼层编号,后面的字母字符是区域的首字母缩写词,最后两个数字字符是床号。
所以2EA 28将是2楼,Ward East和Bed 28。
输入的位置包含不一致的空格,以便我有以下内容:
toyraw<-data.table(incident_no = c(1:6), location =c("2EA17","2EA 17", "1ED1", "1ED23", "1ED 34","ICU24"))
我希望它看起来像以下
toyideal<-data.table(incident_no = c(1:5), location =c("2EA 17","2EA 17", "1ED 1", "1ED 23", "1ED 34", "ICU 24"))
如果前面没有数字,我会一次分出一个数字和一个字符,但因为它是数字,字符数字就会出现问题。有1462行。
进一步的并发症,ICU等地面病房没有先前的病例。
根据请求添加 - 人类可读的名称
人类可读的名字:
additional<-data.table(incident_no = c(1:5), location =c("2EA 17","2EA 17", "1ED 1", "1ED 23", "1ED 34"),
human_Readable = c("Ward 2 East Bed 17","Ward 2 East Bed 17", "Ward 1 Emergency Department
Bed 1", "Ward 1 Emergency Department Bed 23", "Ward 1 Emergency Department Bed 24",
"Ward ICU Bed 24"))
答案 0 :(得分:1)
您可以使用gsub()
:
> gsub("(\\d*)(\\D*)\\s*(\\d*)",
"Floor \\1 Ward \\2 and Bed \\3.",
gsub(" ", "", "1ED 34"))
[1] "Floor 1 Ward ED and Bed 34."
这是我使用的正则表达式:
(\\d*)(\\D*)\\s*(\\d*)