Regex101

Question

我的医院病房数据需要保持一致。第一个数字字符是楼层编号，后面的字母字符是区域的首字母缩写词，最后两个数字字符是床号。

所以2EA 28将是2楼，Ward East和Bed 28。

输入的位置包含不一致的空格，以便我有以下内容：

   toyraw<-data.table(incident_no = c(1:6), location =c("2EA17","2EA 17", "1ED1", "1ED23", "1ED 34","ICU24"))

我希望它看起来像以下

   toyideal<-data.table(incident_no = c(1:5), location =c("2EA 17","2EA 17", "1ED 1", "1ED 23", "1ED 34", "ICU 24"))

如果前面没有数字，我会一次分出一个数字和一个字符，但因为它是数字，字符数字就会出现问题。有1462行。

进一步的并发症，ICU等地面病房没有先前的病例。

根据请求添加 - 人类可读的名称

人类可读的名字：

additional<-data.table(incident_no = c(1:5), location =c("2EA 17","2EA 17", "1ED 1", "1ED 23", "1ED 34"),
                    human_Readable = c("Ward 2 East Bed 17","Ward 2 East Bed 17", "Ward 1 Emergency Department
                                       Bed 1", "Ward 1 Emergency Department Bed 23", "Ward 1 Emergency Department Bed 24",
                                       "Ward ICU Bed 24"))

Answer 1

您可以使用gsub()：

> gsub("(\\d*)(\\D*)\\s*(\\d*)",
       "Floor \\1 Ward \\2 and Bed \\3.",
       gsub(" ", "", "1ED 34"))

[1] "Floor 1 Ward ED and Bed 34."

这是我使用的正则表达式：

(\\d*)(\\D*)\\s*(\\d*)

R中的字符串 - 在所选字母字符和数字字符之间插入空格

1 个答案:

Regex101