我正在尝试从以下网页,文章正文和文章图片中的src中提取2件
任何人都可以告诉我如何在java中提取这两个部分
http://www.ncataggies.com//ViewArticle.dbml?DB_OEM_ID=24500&ATCLID=205417767
答案 0 :(得分:0)
Java还是javascript?
如果我要这样做,当我想要创建页面时,我会打开URL的来源并从class =“article-body”中获取文本,然后在class =“photocopy”中我会刮掉SRC = “”。这将为您提供所有文本和图像的来源。
所以只需加载页面并使用基本字符串操作找到合适的类然后提取内容。
这有帮助吗?如果您需要特定代码的帮助,请先试一试,发布您的内容,然后我就可以帮助您。