从WYSIWYG中提取doc文件

时间:2010-12-28 22:50:52

标签: wordpress ms-word ckeditor wysiwyg blogger

上周我正在研究WYSIWYG - cKeditor。我脑海里浮现出一个问题。有没有办法将doc或docx文件的内容提取或提取到博客或wordpress文本区域。例如,我们不需要从doc(x)文件中选择和复制文本或图像。我们需要做的就是将文件移交给WYSIWYG,并将doc(x)文件的内容粘贴到帖子中。

任何建议都将不胜感激。 谢谢 法瓦兹

1 个答案:

答案 0 :(得分:1)

修改:或者,请参阅this plugin

  

此插件将处理上传的内容   .docx文件,提取所有内容   作为一个帖子。


认为您可以使用PHPWord来提取.docx文件的内容。

(我应该提一下.docx文件只是具有特定结构的.zip文件; Open Office XML

但是,它似乎更专注于编写.docx文件而不是阅读。

PHPWord_Template中包含此类__construct

$this->_objZip = new ZipArchive();
$this->_objZip->open($this->_tempFileName);

$this->_documentXML = $this->_objZip->getFromName('word/document.xml');

返回这样的XML文档:

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<w:document xmlns:ve="http://schemas.openxmlformats.org/markup-compatibility/2006" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:r="http://schemas.openxmlformats.org/officeDocument/2006/relationships" xmlns:m="http://schemas.openxmlformats.org/officeDocument/2006/math" xmlns:v="urn:schemas-microsoft-com:vml" xmlns:wp="http://schemas.openxmlformats.org/drawingml/2006/wordprocessingDrawing" xmlns:w10="urn:schemas-microsoft-com:office:word" xmlns:w="http://schemas.openxmlformats.org/wordprocessingml/2006/main" xmlns:wne="http://schemas.microsoft.com/office/word/2006/wordml">
  <w:body>
    <w:p w:rsidR="005B1098" w:rsidRDefault="005B1098"/>
    <w:p w:rsidR="005B1098" w:rsidRDefault="005B1098">
      ...
      <w:r w:rsidRPr="00F15611">
        <w:rPr>
          <w:rFonts w:ascii="Calibri" w:hAnsi="Calibri" w:cs="Calibri"/>
          <w:lang w:val="en-GB"/>
        </w:rPr>
        <w:t xml:space="preserve">The following table contains a few values that can be edited by the PHPWord_Template class.</w:t>
      </w:r>
      ...
  </w:body>
</w:document>

其中包含文档的文本。

如果您想要继续使用所有格式,看起来使用此方法会有很多工作。比复制和粘贴文本字段要多得多。