我有一个字符串,它将与text和html标记混合,我想要解析和处理。 HTML标记包含对记录ID的引用,我可以在以后编译文本时使用,并为帖子提及段。
在大多数情况下,我理解如何拆分各个细分,但我不知道如何按照他们来的正确顺序让他们回来。
示例字符串:
Hi <span contenteditable="false" data-mention="@005i0000003KteOAAS">First Name</span>
我可以单独解析为'Hi '
和'005i0000003KteOAAS'
,但如何按原始顺序将其恢复?
我目前正在使用这样的正则表达式:
<(?i).*?<\\/.*?>