我有一个字符串属性。
典型值为<p>foo — that's an em dash</p>
。
我需要将其转换为<p>foo — that's an em dash</p>
。
也就是说,我需要不更改HTML标签,但编码未编码的实体。理想情况下,输出位于utf-8
。
这是为了防止这种重复错误:
Encoding::UndefinedConversionError: "\xE2" from ASCII-8BIT to UTF-8 - 0 failed attempts
我尝试了gsub
,force_encoding
和Nokogiri
的各种形式,但没有运气。也许其中一个是朝着正确方向迈出的一步,但我并没有做好一切准备?
我该怎么办?