我在Google云端硬盘上传了一个word文档。我正在以下列两种方式下载HTML格式的文件。
第一种方法:我在Google文档中打开文件,然后下载文件:文件 - >下载为 - >网页(.html,压缩)。我解压缩tar然后我得到HTML文件。它的大小是62 kB。
第二种方法:我使用Drive API v3创建(或上传)word文档到Google云端硬盘。然后我将文件导出为HTML格式。它的大小是173 kB。
我的问题是为什么HTML文件的大小差异几乎是三倍?使用Drive API下载(或导出)时,应该采取哪些措施来获得相同的文件大小(62 kB)?
这是我用来创建和导出文件的Drive API代码。
Drive service = getDriveService();
File fileMetadata = new File();
fileMetadata.setName("Test Document");
fileMetadata.setMimeType("application/vnd.google-apps.document");
FileContent fileContent = new FileContent("application/vnd.openxmlformats-officedocument.wordprocessingml.document", new java.io.File("/home/test/test.doc"));
File createResponse = service.files().create(fileMetadata, fileContent).execute();
java.io.File parentDir = new java.io.File("/home/test/");
if (!parentDir.exists()) {
throw new IOException("Parent directory does not exists.");
}
OutputStream out = new FileOutputStream(new java.io.File(parentDir, "Test Document"));
service.files().export(createResponse.getId(), "text/html").executeAndDownloadTo(out);
请帮我解决这个问题。
感谢。