基本上我已经开始使用python-docx
库来阅读Word文档。到目前为止,我使用了以下代码:
for para in document.paragraphs:
for run in para.runs:
print (run.font.size)
然而,这会打印None
。我的问题是:
如何显示文字的字体大小和字体类型?
或者,如果这不可能,那么我可以根据格式分离所有文本,当我说格式时我指的是字体大小,字体类型,如果它是粗体等等。任何帮助都将不胜感激。
答案 0 :(得分:0)
run.font.size
报告None
,因为该次运行中没有明确指定的大小。这是预期的行为。
我相信您正在寻找的是“有效尺寸”,意味着它在文档中的显示大小。
这是一个具有挑战性的问题,因为在Word中,该大小是由多级样式层次结构中的继承决定的,并且该继承由不良记录的规则控制。
例如,如果此运行位于“正常”样式(默认)的段落中,则它可以从该样式定义继承其大小。
计算大小或任何其他字体特征的有效值需要遍历其样式层次结构并应用优先级规则。 python-docx