我有一套4000个pdf网址,需要提取文档属性,例如文档创建日期,文档大小,页数。
注意:不应下载PDF文档。
请给我一个建议。
此致 阿拉汶
答案 0 :(得分:0)
解决方案没有找到未找到的文件,并且认为不可能。
但是我创建了一个代码来下载文件,获取其属性,然后将其删除。对用户完全透明。
如何使用: 任何细胞类型 = GetPDFData(URL; NumberData)
代表: = getPDFData(A2; 1)
NumbersData:
1 =姓名
2 = DateCreated
3 = DateModificated
4 = PageCount(是“Beta”,有时不工作lol)
5 =尺寸
6 =善意
代码:(将其粘贴到新模块中)
class B(A):
def __init_(self,a,b,c):
super(B, self).__init__(a, b)
self.c = c
我希望你觉得它很有用,或者至少是一个开始
问候!