应用错误收集

好的，有点极端的想法：

您正在谈论的文件是docx？如果没有，我想你可以把它转换成它。

我已经在没有正则表达式的docx文件上尝试过了，但我确信您能够处理这个问题：）

原来如此！

将docx文件解压缩为zip存档
- 您可以将.zip添加到文件名中，作为扩展名，或者只使用归档程序打开 - 例如7zip。
导航到解压缩文件夹下名为word的文件夹。
使用首选编辑器打开document.xml
改变其风格的文字的每个部分都有不同的标记
找到一些看起来像这样的字符串：<w:r w:rsidDel="00000000" w:rsidR="00000000" w:rsidRPr="00000000"><w:rPr><w:b w:val="1"/><w:rtl w:val="0"/></w:rPr><w:t xml:space="preserve">bold text </w:t></w:r>
- 字符串样式部分看起来像^
- 带有1值的标记<w:b w:val="1"/>表示此字符串（＆＃34;粗体文字＆＃34;）具有粗体样式。
创建一个看起来像我上面显示的字符串，然后插入您喜欢的文字。例如，如果您希望新文字具有其他样式（如斜体），请使用<w:i w:val="1"/>（使用i代替b）。

我的例子：
我想添加图片，但我没有足够的声誉:(
它看起来像：

所以，你现在唯一需要做的就是构建一个正则表达式，它会找到包含w:b标签和所有周围环境的部分，而不是你拥有它：）

祝你好运！

编辑：我制作的一个正则表达式示例，它与样式字符串行匹配，就像我在上面的示例中所做的那样：
(<w:r.*?>(?:<w:b\s{1}.*?\/>){1}.*?(?:<w:t\s{1}.*?>(.*?)<\/w:t>)<\/w:r>)

所以你在第一组中有整个样式字符串，只有第二组中的实际文本。