一位老年家庭成员在过去几年中使用Windows记事本录制了一本回忆录,因此每个文件(按年份)都是简单的文字。我的任务是尽可能地对文档进行规范化,以便以后进行打印。我正在努力解决的问题是如何处理每章的标题。在单个文本文件中可以是多个章节条目。一些章节标题很容易获得,例如:
Chapter 1
text
text
text.
chapter two
text
text
但她并不总是那么整洁。她的一些文档包含像
这样的行" chapter
three
"
带有前导和尾随空格,甚至还有CarriageReturn / LineFeed。
我无法获得管理“第三章”情况的语法。以下是我到目前为止所做的事情:
$charstr = ' chapter
three
text here
more text
'
#remove leading spaces
$charstr2 = $charstr.trim()
#find and replace chapter to all caps and start on a new line
$charstr2.Replace("chapter ",''nCHAPTER ')
我肯定会感谢一些帮助如何将多行文本字符串规范化为“第三章”的格式(理想情况下,我将UPPER()这一章 数字,如“第三章”)。
我尝试过使用\,就像在
中一样$ charstr2 = $ charstr.trim()-replace'\ s +', 但我显然做错了什么。
谢谢!
读