阅读带有括号

时间:2018-01-23 13:37:31

标签: python text unicode .doc

我正在尝试将.docx文件读入Python。该文件分为两个表(它是凌乱的),一个是中文字符,另一个是英文。但是,当我从这些表中读取文本时,似乎没有显示括号。

enter image description here

我从.docx文件中读取文本如下

import numpy as np
from docx import Document

doc = Document('2003 PPC for corpus.docx')

chinese_text = doc.tables[0].rows[0].cells[0].text
print(chinese_text)
english_text = doc.tables[0].rows[0].cells[1].text.encode('utf-8')
print(english_text)

然后显示这些打印语句

  

[]女士们,先生们,

  

b"女士们,先生们,早上好,我们非常荣幸

我的问题是为什么我不读中文文本中方括号内的字符。为什么我不读'"(3)"在英文文本的开头?

0 个答案:

没有答案