我试图转换一个包含多个图层的大型docx文档'有序列表到HTML。 (请参阅此处的文档示例:http://docdro.id/X1oyfBv您应该下载它)
我尝试了以下方法,包括:
在线转换器,例如html-cleaner和index.html(只识别列表的一层)
另存为html - 这会创建一个可怕的文件,但仍然无法识别ol结构。
将文件保存为zip,然后打开xml文件,但我没有看到从w:...标签中获取ol结构的简单方法
将其保存到Google文档并运行Omar Alzabir的脚本 http://omaralzabir.com/wp-content/uploads/2014/05/GoogleDocsEmail.jpg
顺便说一句。如果我创建一个包含多个图层的有序列表的单词文件并将其转换,它确实将其识别为ol。但即使我没有列出'取消列表,现有文件也不会被识别为ol。并再次列出。因此,原始文档的创建方式可能有问题(?)
任何建议非常感谢:)或指示为什么会出现此问题
答案 0 :(得分:1)
您是在询问如何将 Word-doc 保存为 HTML 格式的多级有序列表吗?
Word-HTML 在其多级有序列表中存在错误。对于列表项,缩进往往不正确且不一致。有一个例子 here。
Word-HTML 在其多级无序列表中也有类似的错误。一个例子是here。
我最近在 Word 的 HTML 中编写了一个 Python 程序来修复这些错误。该程序是 WordWebNav (WWN) 的一部分,它是免费和开源的。
WWN 是一款可将 Microsoft Word 文档转换为可用网页的应用程序。它在 Word-HTML 网页中添加了一些缺失的功能(例如,导航窗格),并修复了 Word-HTML 中的错误。
答案 1 :(得分:0)
您可以使用//includes
#include "Calculos.h"
#include <iostream>
#include <cstdlib>
#include <thread>
using namespace std;
double fRand(double fMin, double fMax)
{
double f = (double)rand() / RAND_MAX;
return fMin + f * (fMax - fMin);
};
int main() {
cout << "#datos: " << N << endl;
double T[N];
for(int i = 0 ; i < N; i++) {
T[i] = fRand(1.0, 1000.0);
}
thread P[2];
Calculos p1(T, 1);
P[0] = thread(&Calculos::run, p1);
P[0].join();
double m = p1.media; // Here is the problem. p1.media return bad values
cout << "media: " << m << endl;
Calculos p3(T, 3, m);
P[1] = thread(&Calculos::run, p3);
P[1].join();
cout << "Fin\n";
return 0;
}
:https://github.com/jgm/pandoc
这是一个开源通用命令行工具,用于转换基于标记源的文档文件。
您可以将其用作类似的东西:
pandoc