在MongoDb中导入CSV文件(包含一些非UTF8字符)

时间:2013-10-08 16:44:36

标签: mongodb csv utf-8 data-import database

如何将包含一些非UTF8字符的CSV文件导入MongoDB? 我尝试了推荐的导入代码。

mongoimport --db dbname --collection colname --type csv --headerline --file D:/fastfood.xls

错误消息

exception: Invalid UTF8  character detected

我会手动删除这些无效字符,但数据的大小相当大。

尝试谷歌没有成功。

PS:mongo -v = 2.4.6

感谢。

修改 顺便说一下,我在Win7上

3 个答案:

答案 0 :(得分:5)

在Linux中,您可以按照How to remove non UTF-8 characters from text file

中的建议使用iconv命令

iconv -f utf8 -t utf8 -c file.txt

我不熟悉MongoDB,所以我不知道如何在导入过程中保留无效字符。

答案 1 :(得分:1)

For emacs users: Open CSV file in emacs and change encoding using ‘C-x C-m f’ and choosing utf-8 as the coding system. For more information see ChangingEncodings

答案 2 :(得分:0)

您尝试将xls文件作为csv文件导入。首先将文件保存为csv,然后重试。