我正在使用Html2Text
将html代码转换为文本。
效果很好,但我在互联网上找不到很多例子或文档。
我正在以这种方式阅读用户名:
text_to_gain = hxs.xpath('//div[contains(@id,"yq-question-detail-profile-img")]/a/img/@alt').extract()
if text_to_gain:
h = html2text.HTML2Text()
h.ignore_links = True
item['author'] = h.handle(text_to_gain[0])
else:
item['author'] = "anonymous"
但我的输出是这样的:
u'Duncan\n\n'
当我阅读长文本或消息时,它是有用的,但是对于单个字符串或某个字符串,我只想保留名称。
'Duncan'
答案 0 :(得分:5)
使用strip()
功能。这将删除所有空格。
>>> a = u'Duncan\n\n'
>>> a
u'Duncan\n\n'
>>> a.strip()
u'Duncan'
>>> str(a.strip())
'Duncan'
答案 1 :(得分:0)
你也可以这样做,只需删除字符'\ n':
>>> st = 'Duncan\n\n'
>>> st.replace('\n', '')
'Duncan'
>>>