我们目前正在制作报纸的pdf版本,我们有一个.net网站,它捕获要发布的文章,存储输入为html的内容,因此我们可以保持粗体,下划线,删除等样式。
一旦将其存储在数据库中,我们计划使用Indesign创建pdf。我们目前已经构建了一个模板,但是当我们生成一个xml文档并导入Indesign时,html标签就被写出来了。有没有办法绕过这个,让Indesign维护标签,就像它们在html中一样?我们只需要一些简单的,如粗体,三角形,下划线,中心对齐。
感谢。
答案 0 :(得分:6)
Pandoc现在支持导出到ICML(Adobe InCopy的XML格式,可以“放置”在InDesign文档中)。要将HTML转换为ICML:
pandoc --standalone -o output.icml input.html
有关工作流程的详细信息,请参阅pandoc wiki中的Importing Markdown in InDesign。
答案 1 :(得分:5)
您需要将HTML标记转换为CharacterStyles,并在导入时将这些标记应用于XML。
棘手的是,CharacterStyles不能像HTML一样嵌套应用,因此您需要为可能存在的每个组合创建一个CharacterStyle。或者,您可以使用脚本将样式应用于特定的文本运行。
答案 2 :(得分:1)
我们在将xml直接导入InDesign方面遇到了一些不好的经历。
如果您仍然遇到此问题,请查看开源Ickmull代码库。它将xhtml文件转换为idml文件,然后可以在InDesign中打开。这可能是一个更好的网络,可以为您打印工作流程。
答案 3 :(得分:1)
也许你可以使用Markdown to InDesign translater作为起点: http://www.jongware.com/markdownid.html
答案 4 :(得分:1)
Adobe产品已“关闭”用于通用标准(!)导入,例如导入XHTML。
当我们有很多文件时,最大的问题就出现了......
......我今天(2013年)唯一可以使用的方法是(半自动)程序:
此过程优于IDML,因为直接使用XHTML作为InDesign的内容源。它并非适用于所有应用程序,但避免使用 IDML 的非标准转换,避免学习IDML,避免IDML限制,并避免IDML错误的风险。所以,我认为比尝试IDML程序更快。
另一个程序 - 更好,因为它允许表达脚注之类的东西 - 是通过将XML转换为DOCX的XSLT准备从XML到MS-Word的直接转换RFT ......你有这种程序的链接或线索吗?
答案 5 :(得分:0)
这个工具是InDesign导入器的一个不错的HTML: https://www.id-extras.com/html-import-script
可能需要一些返工,但它会带来您可以编辑的样式,并为我节省了大量时间。
答案 6 :(得分:0)
这是一个古老的问题,但是这个问题可能是长期存在的。
这是一种简单的现实世界技术。它可能不完全适合自动工作流程,但是非常适合偶尔使用。
例如,从浏览器的源视图复制html代码。省略头部,css,菜单等,并仅复制可能包含在一系列div,section或其他容器标签中的相关内容。
粘贴纯文本文本文档(在Windows上为记事本,在Mac上为TextEdit)并另存为扩展名为.html
的纯文本文件。
使用LibreOffice打开html文件。我尝试使用版本4和6,它们都解析html就很好了。您将获得一个具有段落样式(如标题)和字符样式(如粗体和斜体)的文档。 (可选)选择全部并将字体更改为Times New Roman。另存为.docx
文件或其他文件类型。
将其导入到InDesign中,并带有用于保留样式以及自动格式化和导入样式的选项。您会得到一个带有段落样式和字符样式的文档,可以根据需要进行编辑。