MongoDB正则表达式查询找到unicode替换字符

时间:2011-09-26 21:35:25

标签: regex unicode mongodb

我正在尝试手动修复Mongo数据库中包含Unicode替换字符的某些文档(看起来像一个问号,请参阅http://www.fileformat.info/info/unicode/char/fffd/index.htm)。我已经解决了为什么这些角色在那里结束但又想保留旧数据的问题。所以我想要的只是一个简单的查询,它返回包含这个字符的所有文档。

到目前为止我想出的是

db.songs.find({artist: /\ufffd/});

查找包含替换字符的艺术家姓名的所有歌曲。到目前为止没有运气。

2 个答案:

答案 0 :(得分:6)

似乎它不喜欢正则表达式中的\uXXXX。尝试:

db.songs.find({artist: new RegExp("\ufffd")});

答案 1 :(得分:1)

要破坏一个旧线程:D为正则表达式,你需要转义反斜杠,否则它将逃避你的转义:

db.songs.find({artist: /\\ufffd/});