如何使用docx包编辑文本

时间:2016-11-25 12:32:24

标签: python unicode ascii python-docx

目标:我想从word文件中读取文本,然后将每个字符的ascii值增加一些预定义的数字(编码类型)并将其保存到同一个文件中。例如:' A'有一个65的ascii所以我需要它成为75.我正在编写下面的代码并且此时仍然坚持它。 `

import docx
from docx import Document
data = Document("C:\Python27\Testing.docx")
for n in data.paragraphs:
    temp= n.text
for d in temp:
    try:
        temp1 = str(temp)
    except UnicodeEncodeError:
        temp1 = temp.encode('ascii','replace')
        pass
print temp1

现在我得到的输出是这样的

This is just a test of what I?m gonna make. Fingers crossed?

,原始字符串是

This is just a test of what I’m gonna make. Fingers crossed…

如何将Unicode字符替换为相应的ascii字符,以便我可以继续进行?请提供一些建议。

0 个答案:

没有答案