从Web / JavaScript内容中删除转义序列的简单方法

时间:2018-06-21 12:02:45

标签: python web beautifulsoup scrapy

我正在使用python scrapy模块抓取一个网页,并得到以下响应:

if (typeof addMoreNewsResults == \'function\') { \r\n
    addMoreNewsResults( {\r\n\t\tblob: \'3DP.AX\',\r\n        
    sortBy: \'date\',\r\n        
    dateRange: \'all\',\r\n        
    totalResultNumber: 2,\r\n        
    totalResultNumberStr: "2",\r\n        
    news: [ \r\n    ]} ); \r\n    }

那里有许多转义的序列。我想删除所有类似\' \r之类的文件。我想知道应该有一些易于使用的软件包来删除那些序列,但是找不到序列。有什么建议吗?


更新:我希望使用功能更强大的软件包的一些建议来代替正则表达式或手动替换。我认为这是一个非常常见的任务,应该是一些具有此功能的软件包:P

1 个答案:

答案 0 :(得分:0)

您可以使用搜索并用正则表达式替换。