有没有办法,使用urllib2或其他方法来检查文件上传到URL的时间?甚至上次修改服务器端文件的时间?
目前我手动使用List grupo1=new ArrayList();
List grupo2=null;
grupo1.addAll((List) lstPrimeraAgrupacion.get(i)); // Copies the list into our new ArrayList pointed to by grupo1
grupo2=(List) lstPrimeraAgrupacion.get(i); // Makes grupo2 point to the existing List so we can modify it directly.
从网址中读取数据。地址的参数每天都在变化。我想做的是弄清楚每个文件何时首次可用,以便我可以选择最佳时间让作业自动运行一夜。
答案 0 :(得分:2)
时间存储在服务器中,通常作为HTTP标头发送到浏览器。您可以使用document.lastModified属性在Javascript中访问它。这是Python中的一个解决方案,它使用正则表达式读取标头并解析信息并打印结果。
def get_upload_datetime(myurl):
info = urllib2.urlopen(myurl).info()
datetime = re.search("Last-Modified: (.+)", str(info))
if datetime:
return datetime.groups()[0]
如果您还在使用网页的内容,请在同一对象上使用urlopen.info()和urlopen.read()(实际只读一次)以避免多次抓取。
如果您想手动执行此操作,请在浏览器中打开网页,打开控制台(Ctrl + Shift + J)并键入javascript:alert(document.lastModified)
。它应该显示一个包含上次修改时间的警告框。