我正在尝试将.docx文件读入Python。该文件分为两个表(它是凌乱的),一个是中文字符,另一个是英文。但是,当我从这些表中读取文本时,似乎没有显示括号。
我从.docx文件中读取文本如下
import numpy as np
from docx import Document
doc = Document('2003 PPC for corpus.docx')
chinese_text = doc.tables[0].rows[0].cells[0].text
print(chinese_text)
english_text = doc.tables[0].rows[0].cells[1].text.encode('utf-8')
print(english_text)
然后显示这些打印语句
[]女士们,先生们,
和
b"女士们,先生们,早上好,我们非常荣幸
我的问题是为什么我不读中文文本中方括号内的字符。为什么我不读'"(3)"在英文文本的开头?