使用html省略号char保存的Python问题

时间:2016-12-15 16:09:31

标签: python lxml python-3.4 openpyxl ellipsis

我打开一个xlsx文件,其中包含与此类似的字符串:

Some text ......

当我使用Openpyxl提取数据并使用lxml将其保存为xml文件时,我得到省略号代码…

我希望它保留...而不是将其转换为… - 想知道处理这个问题的最佳方法是什么。

使用python 2.7不存在此问题,我将脚本转换为python 3.4,这是我看到问题的地方。

代码示例。我在第一行/列中创建了一个带有test的xlsx文件。

test data ......

以下代码提取该数据,当它将其保存时,我会在xml中获取省略号

from openpyxl import load_workbook
from lxml import etree

workbook = load_workbook('test.xlsx')
worksheet = workbook.get_sheet_by_name('Sheet1')
test_data = worksheet.cell(row=1, column=1).value

root = etree.Element("root")
ele = etree.SubElement(root, 'test_data')
ele.text = test_data

et = etree.ElementTree(root)
et.write('test.xml', pretty_print=True)

xml结果

<root>
  <test_data>test data&#8230;&#8230;&#8230;.</test_data>
</root>

修正了写

中的问题
xml.write(path, encoding="utf-8")

0 个答案:

没有答案