Scala通过至少两个连续换行符(\ r \ n \ r \ n)分割多行字符串,并在一行上打印多个分隔符

时间:2017-04-18 09:31:56

标签: regex scala split

我有以下多行字符串:

-- MySQL dump 10.13  Distrib 5.7.15, for Linux (x86_64)
--
-- Host: localhost    Database: 
---- ----------------------------------------------------
-- Server version   5.7.15-0ubuntu0.16.04.1
--------------------------------------------------------
-- test2

/*!40101 SET @OLD_CHARACTER_SET_CLIENT=@@CHARACTER_SET_CLIENT */;
/*!40101 SET @OLD_CHARACTER_SET_RESULTS=@@CHARACTER_SET_RESULTS */;
/*!40101 SET @OLD_COLLATION_CONNECTION=@@COLLATION_CONNECTION */;
/*!40101 SET NAMES utf8 */;
/*!40103 SET @OLD_TIME_ZONE=@@TIME_ZONE */;
/*!40103 SET TIME_ZONE='+00:00' */;
/*!40014 SET @OLD_UNIQUE_CHECKS=@@UNIQUE_CHECKS, UNIQUE_CHECKS=0 */;
/*!40014 SET @OLD_FOREIGN_KEY_CHECKS=@@FOREIGN_KEY_CHECKS, FOREIGN_KEY_CHECKS=0 */;
/*!40101 SET @OLD_SQL_MODE=@@SQL_MODE, SQL_MODE='NO_AUTO_VALUE_ON_ZERO' */;
/*!40111 SET @OLD_SQL_NOTES=@@SQL_NOTES, SQL_NOTES=0 */;

--
-- Current Database: `test`
--

这是对问题(Scala split a multi line string by lines that contain all hyphens

的跟进

我想用所有连字符(作品)和分隔文本块的空行分割这个字符串,我试过(?m)(\ r?\ n \ r?\ n +)|(?m)(^(++ | - + | = + |#+ | _ + | [ - +] | - - +)$)适用于连字符,但不能在空行上分割。

1 个答案:

答案 0 :(得分:1)

您可以使用

val rx = """(?m)\s*^(?:([-+=#_])\1+|\s)+$\s*|(?:\r?\n)+"""
val res = text.split(rx)
print(res.toList.foreach(println))

Scala demo的输出:

-- MySQL dump 10.13  Distrib 5.7.15, for Linux (x86_64)
-- Host: localhost    Database:
-- Server version   5.7.15-0ubuntu0.16.04.1
-- test2
/*!40101 SET @OLD_CHARACTER_SET_CLIENT=@@CHARACTER_SET_CLIENT */;
/*!40101 SET @OLD_CHARACTER_SET_RESULTS=@@CHARACTER_SET_RESULTS */;
/*!40101 SET @OLD_COLLATION_CONNECTION=@@COLLATION_CONNECTION */;
/*!40101 SET NAMES utf8 */;
/*!40103 SET @OLD_TIME_ZONE=@@TIME_ZONE */;
/*!40103 SET TIME_ZONE='+00:00' */;
/*!40014 SET @OLD_UNIQUE_CHECKS=@@UNIQUE_CHECKS, UNIQUE_CHECKS=0 */;
/*!40014 SET @OLD_FOREIGN_KEY_CHECKS=@@FOREIGN_KEY_CHECKS, FOREIGN_KEY_CHECKS=0 */;
/*!40101 SET @OLD_SQL_MODE=@@SQL_MODE, SQL_MODE='NO_AUTO_VALUE_ON_ZERO' */;
/*!40111 SET @OLD_SQL_NOTES=@@SQL_NOTES, SQL_NOTES=0 */;
-- Current Database: `test`

模式详情

  • (?m) - 一个多行修饰符,使^与行首匹配,$匹配行尾
  • \s* - 行开头前的任何0+空格
  • ^ - 开始行
  • (?:([-+=#_])\1+|\s)+ - 包含空格符号和/或重复连续-+=#_符号<的任何行/ LI>
  • $ - 行尾
  • \s* - 行开头前的任何0+空格
  • | - 或
  • (?:\r?\n)+ - 一个或多个换行符(CRLFLF样式)。

请参阅regex demo online