将docx与(ordered)列表转换为html

时间:2015-10-11 16:15:23

标签: html docx

我试图转换一个包含多个图层的大型docx文档'有序列表到HTML。 (请参阅此处的文档示例:http://docdro.id/X1oyfBv您应该下载它)

我尝试了以下方法,包括:

  • 在线转换器,例如html-cleaner和index.html(只识别列表的一层)

  • 另存为html - 这会创建一个可怕的文件,但仍然无法识别ol结构。

  • 将文件保存为zip,然后打开xml文件,但我没有看到从w:...标签中获取ol结构的简单方法

  • 将其保存到Google文档并运行Omar Alzabir的脚本 http://omaralzabir.com/wp-content/uploads/2014/05/GoogleDocsEmail.jpg

顺便说一句。如果我创建一个包含多个图层的有序列表的单词文件并将其转换,它确实将其识别为ol。但即使我没有列出'取消列表,现有文件也不会被识别为ol。并再次列出。因此,原始文档的创建方式可能有问题(?)

任何建议非常感谢:)或指示为什么会出现此问题

2 个答案:

答案 0 :(得分:1)

您是在询问如何将 Word-doc 保存为 HTML 格式的多级有序列表吗?

Word-HTML 在其多级有序列表中存在错误。对于列表项,缩进往往不正确且不一致。有一个例子 here

Word-HTML 在其多级无序列表中也有类似的错误。一个例子是here

我最近在 Word 的 HTML 中编写了一个 Python 程序来修复这些错误。该程序是 WordWebNav (WWN) 的一部分,它是免费和开源的。

WWN 是一款可将 Microsoft Word 文档转换为可用网页的应用程序。它在 Word-HTML 网页中添加了一些缺失的功能(例如,导航窗格),并修复了 Word-HTML 中的错误。

答案 1 :(得分:0)

您可以使用//includes #include "Calculos.h" #include <iostream> #include <cstdlib> #include <thread> using namespace std; double fRand(double fMin, double fMax) { double f = (double)rand() / RAND_MAX; return fMin + f * (fMax - fMin); }; int main() { cout << "#datos: " << N << endl; double T[N]; for(int i = 0 ; i < N; i++) { T[i] = fRand(1.0, 1000.0); } thread P[2]; Calculos p1(T, 1); P[0] = thread(&Calculos::run, p1); P[0].join(); double m = p1.media; // Here is the problem. p1.media return bad values cout << "media: " << m << endl; Calculos p3(T, 3, m); P[1] = thread(&Calculos::run, p3); P[1].join(); cout << "Fin\n"; return 0; } https://github.com/jgm/pandoc

这是一个开源通用命令行工具,用于转换基于标记源的文档文件。

您可以将其用作类似的东西:

pandoc