TinyMCE,Django和python-docx

时间:2018-05-25 08:22:56

标签: django python-docx

我正在研究在我的Django项目中使用rich text editor。 TinyMCE看起来像是一个明显的解决方案,但是我看到输出格式是html(here)。目标是存储用户输入,然后使用python-docx(不是html)在word文档中提供。

你知道有什么解决方案吗?是一个功能的tinyMCE还是 tml到word格式转换器,它可以保存样式,或者另一个富文本编辑器类似于tinymce?

  

更新:

This是我发现工作正常的另一种选择。仍在尝试将HTML转换为Word而不会丢失样式。对于此问题的解决方案可能是pywin32,如here所述,但它对我没有多大帮助+仅限Windows。

  

UPDATE2

经过一番挖掘后,我发现pandocpypandoc似乎可以翻译为以下任何输出格式: "asciidoc, beamer, commonmark, context, docbook, docbook4, docbook5, docx, dokuwiki, dzslides, epub, epub2, epub3, fb2, gfm, haddock, html, html4, html5, icml, jats, json, latex, man, markdown, markdown_github, markdown_mmd, markdown_phpextra, markdown_strict, mediawiki, ms, muse, native, odt, opendocument, opml, org, plain, pptx, revealjs, rst, rtf, s5, slideous, slidy, tei, texinfo, textile, zimwiki"

我还没想出如何将这样的输入集成到python-docx。

1 个答案:

答案 0 :(得分:1)

我遇到了同样的挑战。您将要使用Python的Beautiful Soup库来遍历HTML编辑器中的内容(我使用Summernote,但任何HTML编辑器都应该工作)然后将HTML标记解析为python-docx的可用格式。 Pandoc和Pypandoc将为您转换文件(例如,您从LateX文件开始并需要将其转换为Word),但不提供需要转换为xml / html的工具。

祝你好运!