我有一个类似下面的字符串:
地址123 Address123
这实际上是一个双语地址,我需要将它们分成中文和英文。
程序不是单词Address
并不总是在一堆数字后面,它可能是数字,或者有时是另一个汉字。但您可以假设空格位于Address
前面。
为了使事情变得更复杂,也可以在中文地址找到英文字符。
我可以使用R?
中的正则表达式将其拆分答案 0 :(得分:0)
英语= str_extract(X, “[A-Z] +([A-Z] +)*”)
数据与LT; -data.frame(数据,英语)