正确的前缀迫使MongoDB将字符串解释为unicode?

时间:2016-12-26 21:14:15

标签: mongodb python-3.x unicode

我正在尝试将unicode信息存储在MongoDB数据库中,以便我可以在网页上呈现字符。据我所知,MongoDB以BSON格式存储所有内容,特别是使用utf-8编码存储BSON字符串(按照this link),所以我敢打赌,这个问题可以由比我更了解的人解决。

问题:我想渲染希伯来字符。我创建了一个CSV文件,其中我将其unicode代码点列为纯文本,我需要弄清楚要包含在此文本字符串中的前缀,以便我可以使用MongoDB正确处理它。

诸如“05D8”之类的字符串没有问题 - 在我的CSV文件中,它表示为“05D8”,然后在MongoDB中表示为“05D8”没问题。

然而,字符串“05E0” - 意思是,unicode中的U + 05E0 - 希伯来字母“nun” - 正被MongoDB摄取并强制转换成整数...科学符号解释。希伯来字母表中的十个字符都有这个问题,即使MongoDB正在正确地摄取我的所有其他字符串。

两个问题: Q1:为了让MongoDB将“05E0”视为U + 05E0,我应该在CSV文件的字符串前面放置什么前缀?你'...'...我已经尝试了u'05E0',但是它被存储在MongoDB中作为“u'05E0”,这不是我想要的。(这是我的问题,不是mongo的问题 - 我只是无法弄清楚在CSV文件中输入什么内容)

Q2:mongoimport是否有一个标志,我可以强制将此CSV中的信息解释为文本而不是科学记数法?

0 个答案:

没有答案