从服务器获取文件上载时间

时间:2015-06-11 14:33:39

标签: python urllib2 urllib

有没有办法,使用urllib2或其他方法来检查文件上传到URL的时间?甚至上次修改服务器端文件的时间?

目前我手动使用List grupo1=new ArrayList(); List grupo2=null; grupo1.addAll((List) lstPrimeraAgrupacion.get(i)); // Copies the list into our new ArrayList pointed to by grupo1 grupo2=(List) lstPrimeraAgrupacion.get(i); // Makes grupo2 point to the existing List so we can modify it directly. 从网址中读取数据。地址的参数每天都在变化。我想做的是弄清楚每个文件何时首次可用,以便我可以选择最佳时间让作业自动运行一夜。

1 个答案:

答案 0 :(得分:2)

时间存储在服务器中,通常作为HTTP标头发送到浏览器。您可以使用document.lastModified属性在Javascript中访问它。这是Python中的一个解决方案,它使用正则表达式读取标头并解析信息并打印结果。

def get_upload_datetime(myurl):
    info = urllib2.urlopen(myurl).info() 
    datetime = re.search("Last-Modified: (.+)", str(info))
    if datetime:
        return datetime.groups()[0]

如果您还在使用网页的内容,请在同一对象上使用urlopen.info()和urlopen.read()(实际只读一次)以避免多次抓取。

如果您想手动执行此操作,请在浏览器中打开网页,打开控制台(Ctrl + Shift + J)并键入javascript:alert(document.lastModified)。它应该显示一个包含上次修改时间的警告框。