应用错误收集

我的应用程序有数千（可能是数百万？）的模型，让我们称它们为段落，其中包含文本。该文本的主要用途是将其显示在网页上。有时，由于各种其他原因，也会搜索该文本。

其中一些段落中的某些词语具有相关的元数据，例如格式，超链接或其他对前端javascript有意义的数据属性。

现在，我只是将最终的html标签直接插入到文本中，因此它最终会像这样存储：

<strong>Jimmy</strong> is walking his <a href="somewhere">dog</a> which is <span class="something" data-metadata_id="2343">brown</span>.

这对于显示文本的主要目的很有效，但是当我想搜索我的文本或对其进行其他处理时，它非常难看。有没有更好的办法？是否有处理此类事情的宝石？