如何以编程方式将HTML转换为epub?

时间:2010-08-11 02:40:53

标签: html automation epub

我可以使用任何编程语言或库进行此转换吗?

7 个答案:

答案 0 :(得分:54)

简短的回答是肯定的,它可以用任何编程语言完成。

基本步骤:

  1. 将您的HTML转换为XHTML(+ CSS)。这可以在您的程序中完成,也可以通过XSLT文件完成。
  2. 将文件(XHTML,CSS,任何图像和字体)复制到符合格式的目录结构中。
  3. 向上压缩目录结构,并使用“.epub”扩展名命名存档。
  4. 一些帮助您入门的网站:

    2015年6月注: epubcheck验证器已从谷歌代码转移到GitHub;请注意新网址。

答案 1 :(得分:15)

Calibre支持各种输入格式,包括HTML和各种输出格式,包括EPUB,但它不是“编程语言或库”。是否有特定原因需要基于编程的方法而不是独立工具?如果是这样,可能Python和ebookmaker.py可以帮助你。

答案 2 :(得分:3)

迟到的回复,但我发现基于Python 3的ebookmaker是有价值的,至少在我提交拉取请求以删除UTF-8 BOM之后。它的一个问题似乎是它使用brittle regular expressions to parse HTML,但我想我必须在那里报告。

答案 3 :(得分:1)

这是pdf to epub,我知道这不是你想要的,但这是一个开始。

calibre包可能包含您想要的内容

答案 4 :(得分:1)

我使用Aspose中的以下库 - http://www.aspose.com/categories/.net-components/aspose.words-for-.net/default.aspx

在两行代码中,我可以执行html到epub转换。目前在生产系统中使用它。

文档doc = new Document(_sourceFilePath);

doc.Save(_destinationFilePath,SaveFormat.Epub);

答案 5 :(得分:1)

我刚开始用Java(OpenJDK兼容)实现这样的工具:html2epub。为了摆脱手动编辑配置文件,我可能会启动一个单独的工具来从任何给定目录生成配置文件(但是,仍然需要确定EPUB中XHTML的顺序 - 对于非 - 程序设计使用,开发GUI辅助工具可以考虑,对于一个完全灵活的程序设计解决方案,我还没有提出一个想法)。在此之前,我为自定义XML输入(hag2epub tools)实现了基于shell脚本的转换器 - 如果您感兴趣,我可能会将它们移植到XHTML输入(使用EPUB元数据的配置文件或从中获取元数据)目录的最顶层index.html(如果存在)。

答案 6 :(得分:0)

我之前有同样的问题,因为我想在iPad上离线阅读一些网页内容。我不知道,我不是一个精通计算机的人。有口径或节blabla ....

但对我来说,他们只是格式转换器,我需要一个ePub书籍创建者,这将允许我将许多所需的文档组合在一起阅读。然后我找到了书呆子html to ePub converter,我从网上保存了html页面,然后用它进行转换。这对我来说是一个非常好的工具。