这就是它。我正在使用Nokogiri来抓取一个网页,其中包括’其中的字符,我无法弄清楚如何进行转换。这是我试过的:
str.gsub(/’/,"'")
str.gsub("’","'")
str.gsub("ΓÇÖ","'") # that's how it looks when I do a puts
(在上面,&amp;#8217和“;”之间没有空格,但是如果我不把空间放进去,那么将它转换成撇号 - 残忍,残酷的讽刺!)< / p>
我确信这在某个地方有所涉及,但无法在此处或在网络上找到解决方案。
TIA
答案 0 :(得分:2)
str.gsub(“\ 342 \ 200 \ 231”,“'”)应该有效
我得到了这个:
'''。to_s输出“\ 342 \ 200 \ 231”
可替换的其他html字符(http://ask.metafilter.com/62656/Eliminating-odd-characters-from-web-site):
<\ n>“\ 342 \ 200 \ 176” - “”“ “\ 342 \ 200 \ 177” - “'”