如何在R中使用正则表达式将英文和中文的字符串分成两半?

时间:2013-10-10 09:58:28

标签: regex r

我有一个类似下面的字符串:

地址123 Address123

这实际上是一个双语地址,我需要将它们分成中文和英文。

程序不是单词Address并不总是在一堆数字后面,它可能是数字,或者有时是另一个汉字。但您可以假设空格位于Address前面。

为了使事情变得更复杂,也可以在中文地址找到英文字符。

我可以使用R?

中的正则表达式将其拆分

1 个答案:

答案 0 :(得分:0)

英语= str_extract(X, “[A-Z] +([A-Z] +)*”)

数据与LT; -data.frame(数据,英语)