我使用Node.js脚本进行抓取,我注意到其中一个字符串被删除只是没有通过正则表达式.Regex在这里并不重要,但字符串行为奇怪,这里'例子:
var scrapedData = '1111 test1'
var myData = '1111 test1'
scrapedData === myData
false
现在,如果在scrapedData内手动删除1111和test1之间的空格,然后输入空格,一切正常。
var scrapedData = '1111 test1' // manually deleted and then added space
var myData = '1111 test1'
scrapedData === myData
true
所以我猜scrapedData
包含一些破坏我的正则表达式的隐藏字符,它可能与编码有关(使用了utf-8)?它可以替换为单个空格字符' '
吗?
答案 0 :(得分:1)
也许这会有所帮助:
尝试使用escape来查看实际的char。例如:
escape('1111 test1')
应该返回" 1111%20test1"如果char真的是一个空间。