php - 正确格式化数据库中的HTML

我正在使用TinyMCE将一些HTML保存到phpMyAdmin中的SQL表中。从表中插入和检索行可以正常工作。

我正在使用正则表达式来翻译检索到的文本中的一些短代码，这就是出现问题的地方。

这是我的正则表达式，它只是在两个带有可能的html标签和新行的短代码之间获取文本：

/(<.+>)?[[]{$code}[]](<\/.+>)?((?:\n.+\n?)+)(<.+>)?[[]{$code}[]](<\/.+>)?/

当我从数据库中检索HTML并在其上运行正则表达式时，preg_match_all()无法匹配任何内容，但是当我双击数据库中的行并打开内联编辑器时，phpMyAdmin做某事并自动对行执行更新并将文本设置为新值;然后，当我对新更新的值运行正则表达式时，preg_match_all()匹配正确的值。

我认为这是一些自动文本编码转换或其他东西，但在插入之前在HTML上运行mb_detect_encoding()确实证实编码是UTF-8，与表utf8_unicode_ci相同。 / p>

然后我在Notepad ++中比较了更新前后的文本和EOL字符，它们完全相同，但是我的正则表达式在phpMyAdmin更新之前不起作用。

什么是phpMyAdmin修复文本，如何在插入数据库之前完成？为什么它会自动更新行？

正确格式化数据库中的HTML

1 个答案: