Question

我正在尝试解析从reddit抓取的文本并将其清理为nlp，但是该文本在每个单引号之前都有反斜杠。但是，当我尝试使用string.replace时，似乎没有任何效果，\保持不变

print(submission.selftext.replace('\n','').replace('\\\'','\''))

要清楚，替换本身没有问题，它可以删除末端线。如何使替换识别这些字符？

Answer 1

您可以写chr(92)来代替\

>>> print(chr(92))
\

返回表示Unicode代码点为整数i。例如，chr（97）返回字符串“ a”，而 chr（8364）返回字符串“€”。这是ord（）的反函数。