用双破折号替换Emdash

时间:2018-07-23 18:16:21

标签: encoding special-characters python-3.6

我想将―替换为- 我尝试使用utf8编码,但这不起作用

string = "blablabla -- blablabla ―"

我想用双连字符替换长破折号(如果有的话)。我用简单的方法尝试过,但是没用:

string= string.replace ("―", "--")

我还尝试使用utf8对其进行编码,并使用特殊字符的代码

stringutf8= string.encode("utf-8")
emdash= u"\u2014"
hyphen= u"\u002D"

if emdash in stringutf8:
    stringutf8.replace(emdash, 2*hyphen)

有什么建议吗?

我正在处理文本文件,有时显然两个连字符会自动替换为长划线...

非常感谢!

1 个答案:

答案 0 :(得分:2)

您在这里处理字符串。字符串是字符列表。替换 character ,将编码保留在等式之外。

string = 'blablabla -- blablabla \u2014'
emdash = '\u2014'
hyphen = '\u002D'

string2 = string.replace(emdash, 2*hyphen)