从java中的HTML文件中的javascript img标签中提取图像链接

时间:2015-10-28 20:53:00

标签: javascript java html tags

我正在使用apache tika解析器来解析html文件,tika提取img标签内的图像链接,如下所示:

<img ....some variables... src="http://some image.jpg" ....some variables...>

但它无法提取图像链接,例如:

<img ....some variables... image-src="http://some image.jpg" ....some variables...>

或:

<img ....some variables... data-original="http://some image.jpg" ....some variables...>

或其他一些“src”的变量。 是否有可能在java中提取这些图像链接?

0 个答案:

没有答案