我正在使用apache tika解析器来解析html文件,tika提取img标签内的图像链接,如下所示:
<img ....some variables... src="http://some image.jpg" ....some variables...>
但它无法提取图像链接,例如:
<img ....some variables... image-src="http://some image.jpg" ....some variables...>
或:
<img ....some variables... data-original="http://some image.jpg" ....some variables...>
或其他一些“src”的变量。 是否有可能在java中提取这些图像链接?