这有点难以解释,但我会尝试。
我们在工作中有一个员工网页目录,显示员工照片及其电话分机号码等。它是一个用javascript编写的动态页面,每个页面都有相同的布局,但很明显,图像的链接总是不同。
现在我想要做些什么就是抓住那些在我们的连续构建服务器中使用的图像(这是人们要求信不信任的东西),所以当有人打破构建时我可以将它们嵌入到破碎的构建电子邮件。我可以生成人员详细信息页面的网页链接,但不知道如何从中获取图像链接(没有明显的命名约定) - 我没有访问存储图像的网络共享但是有权访问如果我能搞清楚,请在邮件中嵌入一个链接。
我对我可以使用的语言非常灵活我只是好奇如何完成这项任务
答案 0 :(得分:1)
网络目录必须在某个时刻为图像发出HTTP请求。如果您可以找到该请求的详细信息,那么您可以提出相同的请求来获取图像。 “Web Scraping Proxy”以Perl代码的形式记录HTTP请求/响应。设置它,在web目录中导航到图像,然后查看代理的日志。