我正在使用以下RSS:http://aplicaciones.esi.us.es/antalumnos/rss.xml
正如我们所看到的,description标签包含我需要的文本,并且它在文本之间充满了CSS代码。这是一个问题,因为一旦我解析了描述标记,我也得到了所有的CSS代码。
RSS链接是用drupal 6制作的,它不能被更改,而其他RSS阅读器作为feedly显示所有内容完美,没有文本之间的代码。我该如何处理这个问题?
<description>
<p>&nbsp;<span style="color: rgb(51, 51, 51); font-family: Verdana, Geneva, sans-serif; font-size: 13.3333px; background-color: rgb(255, 255, 255);">El pasado sábado 11 de Junio cerramos la temporada de rutas en bici organizadas por la Asociación con un recorrido de 72 Km por la conocida y espectacular Vía Verde de la Sierra. Con un día soleado y no excesivamente caluroso partimos con nuestras máquinas desde la estación de Puerto Serrano en dirección a Olvera, disfrutando de un bello y rico entorno natural fuimos avanzando con paradas en los sitios más singulares (Chaparro de la Vega, estación de Coripe, Peñón de Zaframagón y estación de Olvera. Una vez aquí retornamos al punto de partida.</span></p>
<div style="padding-top: 0px; border-top-width: 0px; color: rgb(51, 51, 51); font-family: Verdana, Geneva, sans-serif; font-size: 13.3333px; background-color: rgb(255, 255, 255);">
<p>A pesar de la distancia recorrida la ruta se hizo llevadera gracias a la coincidencia de varios factores como la buena compañía, la belleza del entorno, un buen firme parq rodar sin muchos desniveles y con treinta túneles en los que refrescarse a su paso.</p>
<p>Finalmente en el restaurante de la estación de Puerto Serrano compartimos, como de costumbre, un agradable rato para reponer energías degustando los productos de la zona.</p>
<p>Facilitamos algunas fotos:</p>
</div>
<div style="color: rgb(51, 51, 51); font-family: Verdana, Geneva, sans-serif; font-size: 13.3333px; background-color: rgb(255, 255, 255);">&nbsp;</div>
<div style="color: rgb(51, 51, 51); font-family: Verdana, Geneva, sans-serif; font-size: 13.3333px; background-color: rgb(255, 255, 255);"><a title="http://aplicaciones.esi.us.es/antalumnos/node/3144" href="http://aplicaciones.esi.us.es/antalumnos/node/3144" target="_blank" rel="noreferrer" style="color: rgb(1, 134, 186);">http://aplicaciones.esi.us.es/antalumnos/node/3144</a></div>
</description>
答案 0 :(得分:1)
替换style=...
的所有出现的最好方法是使用正则表达式(正则表达式),我认为这是你要删除的CSS代码部分。我使用此site作为参考。这是一个小例子:
String text = "style="hfhdjdh;" YAY";
String regex = "(style=")(.*)(")";
System.out.println(text.replaceAll(regex, "replaced"));
这将输出replaced YAY
。基本上,就像在我的评论中一样,正则表达式找到的地方有style="
,(。*)忽略内部的任何内容,我们用另一个"
标记结尾。您只需要用空格或简单的空字符串更改替换字符串,它将从您的内容中删除它。 replaceAll
应删除所有出现的内容,因此您无需逐行搜索。