我正在尝试解析从reddit抓取的文本并将其清理为nlp,但是该文本在每个单引号之前都有反斜杠。但是,当我尝试使用string.replace时,似乎没有任何效果,\保持不变
print(submission.selftext.replace('\n','').replace('\\\'','\''))
要清楚,替换本身没有问题,它可以删除末端线。如何使替换识别这些字符?
答案 0 :(得分:1)
您可以写chr(92)
来代替\
>>> print(chr(92))
\
https://docs.python.org/3/library/functions.html#chr
返回表示Unicode代码点为 整数i。例如,chr(97)返回字符串“ a”,而 chr(8364)返回字符串“€”。这是ord()的反函数。