如何解析/格式化充满CSS代码

时间:2016-06-28 00:20:03

标签: java android css xml rss

我正在使用以下RSS:http://aplicaciones.esi.us.es/antalumnos/rss.xml

正如我们所看到的,description标签包含我需要的文本,并且它在文本之间充满了CSS代码。这是一个问题,因为一旦我解析了描述标记,我也得到了所有的CSS代码。

RSS链接是用drupal 6制作的,它不能被更改,而其他RSS阅读器作为feedly显示所有内容完美,没有文本之间的代码。我该如何处理这个问题?

   <description>
&lt;p&gt;&amp;nbsp;&lt;span style=&quot;color: rgb(51, 51, 51); font-family: Verdana, Geneva, sans-serif; font-size: 13.3333px; background-color: rgb(255, 255, 255);&quot;&gt;El pasado sábado 11 de Junio cerramos la temporada de rutas en bici organizadas por la Asociación con un recorrido de 72 Km por la conocida y espectacular Vía Verde de la Sierra. Con un día soleado y no excesivamente caluroso partimos con nuestras máquinas desde la estación de Puerto Serrano en dirección a Olvera, disfrutando de un bello y rico entorno natural fuimos avanzando con paradas en los sitios más singulares (Chaparro de la Vega, estación de Coripe, Peñón de Zaframagón y estación de Olvera. Una vez aquí retornamos al punto de partida.&lt;/span&gt;&lt;/p&gt;
&lt;div style=&quot;padding-top: 0px; border-top-width: 0px; color: rgb(51, 51, 51); font-family: Verdana, Geneva, sans-serif; font-size: 13.3333px; background-color: rgb(255, 255, 255);&quot;&gt;
&lt;p&gt;A pesar de la distancia recorrida la ruta se hizo llevadera gracias a la coincidencia de varios factores como la buena compañía, la belleza del entorno, un buen firme parq rodar sin muchos desniveles y con treinta túneles en los que refrescarse a su paso.&lt;/p&gt;
&lt;p&gt;Finalmente en el restaurante de la estación de Puerto Serrano compartimos, como de costumbre, un agradable rato para reponer energías degustando los productos de la zona.&lt;/p&gt;
&lt;p&gt;Facilitamos algunas fotos:&lt;/p&gt;
&lt;/div&gt;
&lt;div style=&quot;color: rgb(51, 51, 51); font-family: Verdana, Geneva, sans-serif; font-size: 13.3333px; background-color: rgb(255, 255, 255);&quot;&gt;&amp;nbsp;&lt;/div&gt;
&lt;div style=&quot;color: rgb(51, 51, 51); font-family: Verdana, Geneva, sans-serif; font-size: 13.3333px; background-color: rgb(255, 255, 255);&quot;&gt;&lt;a title=&quot;http://aplicaciones.esi.us.es/antalumnos/node/3144&quot; href=&quot;http://aplicaciones.esi.us.es/antalumnos/node/3144&quot; target=&quot;_blank&quot; rel=&quot;noreferrer&quot; style=&quot;color: rgb(1, 134, 186);&quot;&gt;http://aplicaciones.esi.us.es/antalumnos/node/3144&lt;/a&gt;&lt;/div&gt;
</description>

1 个答案:

答案 0 :(得分:1)

替换style=...的所有出现的最好方法是使用正则表达式(正则表达式),我认为这是你要删除的CSS代码部分。我使用此site作为参考。这是一个小例子:

String text = "style=&quot;hfhdjdh;&quot; YAY";
String regex = "(style=&quot;)(.*)(&quot;)";
System.out.println(text.replaceAll(regex, "replaced"));

这将输出replaced YAY。基本上,就像在我的评论中一样,正则表达式找到的地方有style=&quot;,(。*)忽略内部的任何内容,我们用另一个&quot;标记结尾。您只需要用空格或简单的空字符串更改替换字符串,它将从您的内容中删除它。 replaceAll应删除所有出现的内容,因此您无需逐行搜索。