Question

我有一套4000个pdf网址，需要提取文档属性，例如文档创建日期，文档大小，页数。

注意：不应下载PDF文档。

请给我一个建议。

此致阿拉汶

Answer 1

好吧......我正在写一点并在互联网上寻找解决方案......

解决方案没有找到未找到的文件，并且认为不可能。

但是我创建了一个代码来下载文件，获取其属性，然后将其删除。对用户完全透明。

如何使用：任何细胞类型 = GetPDFData（URL; NumberData）

代表： = getPDFData（A2; 1）

NumbersData：

1 =姓名

2 = DateCreated

3 = DateModificated

4 = PageCount（是“Beta”，有时不工作lol）

5 =尺寸

6 =善意

代码:(将其粘贴到新模块中）

class B(A):
    def __init_(self,a,b,c):
        super(B, self).__init__(a, b)
        self.c = c

我希望你觉得它很有用，或者至少是一个开始

问候！