将Html导入Adobe Indesign

时间:2012-03-01 14:38:39

标签: html import adobe-indesign

我们目前正在制作报纸的pdf版本,我们有一个.net网站,它捕获要发布的文章,存储输入为html的内容,因此我们可以保持粗体,下划线,删除等样式。

一旦将其存储在数据库中,我们计划使用Indesign创建pdf。我们目前已经构建了一个模板,但是当我们生成一个xml文档并导入Indesign时,html标签就被写出来了。有没有办法绕过这个,让Indesign维护标签,就像它们在html中一样?我们只需要一些简单的,如粗体,三角形,下划线,中心对齐。

感谢。

7 个答案:

答案 0 :(得分:6)

Pandoc现在支持导出到ICML(Adobe InCopy的XML格式,可以“放置”在InDesign文档中)。要将HTML转换为ICML:

pandoc --standalone -o output.icml input.html

有关工作流程的详细信息,请参阅pandoc wiki中的Importing Markdown in InDesign

答案 1 :(得分:5)

您需要将HTML标记转换为CharacterStyles,并在导入时将这些标记应用于XML。

棘手的是,CharacterStyles不能像HTML一样嵌套应用,因此您需要为可能存在的每个组合创建一个CharacterStyle。或者,您可以使用脚本将样式应用于特定的文本运行。

答案 2 :(得分:1)

我们在将xml直接导入InDesign方面遇到了一些不好的经历。

如果您仍然遇到此问题,请查看开源Ickmull代码库。它将xhtml文件转换为idml文件,然后可以在InDesign中打开。这可能是一个更好的网络,可以为您打印工作流程。

http://code.google.com/p/ickmull/

答案 3 :(得分:1)

也许你可以使用Markdown to InDesign translater作为起点: http://www.jongware.com/markdownid.html

答案 4 :(得分:1)

Adob​​e产品已“关闭”用于通用标准(!)导入,例如导入XHTML

如何抗议Adobe?!

当我们有很多文件时,最大的问题就出现了......


批处理的解决方案(很多文章)

......我今天(2013年)唯一可以使用的方法是(半自动)程序:

  1. [手册,准备] 检查我的InDesign“模板”文件,该文件将用作“导入程序”: 样式 易读的名称 必须定义。 PS:它们在HTML + CSS导出中都可见(列出)。
  2. [手册,准备] 调整我的(X)HTML文件以使用CSS 名称表达所有相关样式(不是通过样式属性)既不是奇怪的班级名字);
  3. [自动,批处理] 将我的所有(X)HTML文件转换为,自动使用Python OpenDocument Converter
  4. [ InDesign辅助,最终处理] 从InDesign中的“模板”(第1项)文件克隆导入每个DOC (第2项)将由InDesign样式自动转换。
  5. 此过程优于IDML,因为直接使用XHTML作为InDesign的内容源。它并非适用于所有应用程序,但避免使用 IDML 的非标准转换,避免学习IDML,避免IDML限制,并避免IDML错误的风险。所以,我认为比尝试IDML程序更快。


    另一个程序 - 更好,因为它允许表达脚注之类的东西 - 是通过将XML转换为DOCX的XSLT准备从XML到MS-Word的直接转换RFT ......你有这种程序的链接或线索吗?

答案 5 :(得分:0)

这个工具是InDesign导入器的一个不错的HTML: https://www.id-extras.com/html-import-script

可能需要一些返工,但它会带来您可以编辑的样式,并为我节省了大量时间。

答案 6 :(得分:0)

这是一个古老的问题,但是这个问题可能是长期存在的。

这是一种简单的现实世界技术。它可能不完全适合自动工作流程,但是非常适合偶尔使用。

  1. 例如,从浏览器的源视图复制html代码。省略头部,css,菜单等,并仅复制可能包含在一系列div,section或其他容器标签中的相关内容。

  2. 粘贴纯文本文本文档(在Windows上为记事本,在Mac上为TextEdit)并另存为扩展名为.html的纯文本文件。

  3. 使用LibreOffice打开html文件。我尝试使用版本4和6,它们都解析html就很好了。您将获得一个具有段落样式(如标题)和字符样式(如粗体和斜体)的文档。 (可选)选择全部并将字体更改为Times New Roman。另存为.docx文件或其他文件类型。

  4. 将其导入到InDesign中,并带有用于保留样式以及自动格式化和导入样式的选项。您会得到一个带有段落样式和字符样式的文档,可以根据需要进行编辑。