我有一个大文件。大多数线都是这样的 (记录号码点空间姓氏,名字)
1. Moore, Roger
2. Connery, Sean
3. ....
100. Dalton, Timothy
.. 偶尔有些不愉快的行就像这样
110. Bronson, Pierce 111. Gomez, Selena 112. Portman, Nathalie
我需要一个正则表达式来打破那些不喜欢的行,就像这样
110. Bronson, Pierce
111. Gomez, Selena
112. Portman, Nathalie
某些行可能有两个记录,但有些行可能有五个或更多记录。 我是如何得到它们的,当我将pdf文档复制/粘贴到Textwrangler中时,会出现类似的行。 我使用文本管理器。
答案 0 :(得分:0)
正则表达式:+(?=\d+\.)
或\s+(?=\d+\.)
替换:\n
详细说明:
\s
匹配任何空格字符(等于[\r\n\t\f\v ]
)+
匹配一次且无限次(?=)
积极前瞻\d
匹配一个数字(等于[0-9]
)答案 1 :(得分:0)
我多年没有使用过 Text Wrangler ,但它具有正则表达式功能。您需要使用正则表达式查找和替换。
Here是一个正在运行的正则表达式,它显示了带有额外编号条目的所有行的标识。
您希望将其匹配的内容替换为
之类的内容\n$1
其中\n
是换行符,$1
是匹配中捕获的文本,因此应该导致
- Bronson,Pierce 111. Gomez,Selena 112. Portman,Nathalie
醇>
前往
- 布朗森,皮尔斯
- Gomez,Selena
- Portman,Nathalie
醇>