如何将包含一些非UTF8字符的CSV文件导入MongoDB? 我尝试了推荐的导入代码。
mongoimport --db dbname --collection colname --type csv --headerline --file D:/fastfood.xls
错误消息
exception: Invalid UTF8 character detected
我会手动删除这些无效字符,但数据的大小相当大。
尝试谷歌没有成功。
PS:mongo -v = 2.4.6
感谢。
修改 顺便说一下,我在Win7上
答案 0 :(得分:5)
在Linux中,您可以按照How to remove non UTF-8 characters from text file
中的建议使用iconv
命令
iconv -f utf8 -t utf8 -c file.txt
我不熟悉MongoDB,所以我不知道如何在导入过程中保留无效字符。
答案 1 :(得分:1)
For emacs users: Open CSV file in emacs and change encoding using ‘C-x C-m f’ and choosing utf-8 as the coding system. For more information see ChangingEncodings
答案 2 :(得分:0)
您尝试将xls
文件作为csv
文件导入。首先将文件保存为csv
,然后重试。