我有以下多行字符串:
-- MySQL dump 10.13 Distrib 5.7.15, for Linux (x86_64)
--
-- Host: localhost Database:
---- ----------------------------------------------------
-- Server version 5.7.15-0ubuntu0.16.04.1
--------------------------------------------------------
-- test2
/*!40101 SET @OLD_CHARACTER_SET_CLIENT=@@CHARACTER_SET_CLIENT */;
/*!40101 SET @OLD_CHARACTER_SET_RESULTS=@@CHARACTER_SET_RESULTS */;
/*!40101 SET @OLD_COLLATION_CONNECTION=@@COLLATION_CONNECTION */;
/*!40101 SET NAMES utf8 */;
/*!40103 SET @OLD_TIME_ZONE=@@TIME_ZONE */;
/*!40103 SET TIME_ZONE='+00:00' */;
/*!40014 SET @OLD_UNIQUE_CHECKS=@@UNIQUE_CHECKS, UNIQUE_CHECKS=0 */;
/*!40014 SET @OLD_FOREIGN_KEY_CHECKS=@@FOREIGN_KEY_CHECKS, FOREIGN_KEY_CHECKS=0 */;
/*!40101 SET @OLD_SQL_MODE=@@SQL_MODE, SQL_MODE='NO_AUTO_VALUE_ON_ZERO' */;
/*!40111 SET @OLD_SQL_NOTES=@@SQL_NOTES, SQL_NOTES=0 */;
--
-- Current Database: `test`
--
这是对问题(Scala split a multi line string by lines that contain all hyphens)
的跟进我想用所有连字符(作品)和分隔文本块的空行分割这个字符串,我试过(?m)(\ r?\ n \ r?\ n +)|(?m)(^(++ | - + | = + |#+ | _ + | [ - +] | - - +)$)适用于连字符,但不能在空行上分割。
答案 0 :(得分:1)
您可以使用
val rx = """(?m)\s*^(?:([-+=#_])\1+|\s)+$\s*|(?:\r?\n)+"""
val res = text.split(rx)
print(res.toList.foreach(println))
Scala demo的输出:
-- MySQL dump 10.13 Distrib 5.7.15, for Linux (x86_64)
-- Host: localhost Database:
-- Server version 5.7.15-0ubuntu0.16.04.1
-- test2
/*!40101 SET @OLD_CHARACTER_SET_CLIENT=@@CHARACTER_SET_CLIENT */;
/*!40101 SET @OLD_CHARACTER_SET_RESULTS=@@CHARACTER_SET_RESULTS */;
/*!40101 SET @OLD_COLLATION_CONNECTION=@@COLLATION_CONNECTION */;
/*!40101 SET NAMES utf8 */;
/*!40103 SET @OLD_TIME_ZONE=@@TIME_ZONE */;
/*!40103 SET TIME_ZONE='+00:00' */;
/*!40014 SET @OLD_UNIQUE_CHECKS=@@UNIQUE_CHECKS, UNIQUE_CHECKS=0 */;
/*!40014 SET @OLD_FOREIGN_KEY_CHECKS=@@FOREIGN_KEY_CHECKS, FOREIGN_KEY_CHECKS=0 */;
/*!40101 SET @OLD_SQL_MODE=@@SQL_MODE, SQL_MODE='NO_AUTO_VALUE_ON_ZERO' */;
/*!40111 SET @OLD_SQL_NOTES=@@SQL_NOTES, SQL_NOTES=0 */;
-- Current Database: `test`
模式详情:
(?m)
- 一个多行修饰符,使^
与行首匹配,$
匹配行尾\s*
- 行开头前的任何0+空格^
- 开始行(?:([-+=#_])\1+|\s)+
- 包含空格符号和/或重复连续-
,+
,=
,#
,_
符号<的任何行/ LI>
$
- 行尾\s*
- 行开头前的任何0+空格|
- 或(?:\r?\n)+
- 一个或多个换行符(CRLF
或LF
样式)。