使用python本机库docx从docx表中提取特定单词

时间:2014-05-22 18:55:50

标签: python-2.7 unicode key-value python-docx

我的代码的主要目标是从docx表中提取特定的单词。

TextDoc.docx

Docx table

Extract.py

from docx import *
mydoc = opendocx('/home/user/TestDoc.docx')    
search(mydoc,'Key1')

我的结果为 True ,但我的目标是

get_value('Key1')

输出应该是

Value1

帮助将不胜感激。

1 个答案:

答案 0 :(得分:3)

我不相信你可以直接使用旧版本的python-docx。您需要使用最新版本(~0.5.0),它具有不同的API。

pip uninstall docx
pip install python-docx

这样的事情应该有效:

from docx import Document

document = Document('..path..')
table = document.tables[0]
cell = table.row[0].cells[0]
paragraph = cell.paragraphs[0]
text = paragraph.text

python-docx的文档在这里:http://python-docx.readthedocs.org/