word2vec生成的.bin文件不可读

时间:2017-04-07 07:03:45

标签: word2vec

我是word2vec的新手。我在python中运行了word2vec代码,给出了一个要训练的语料库。模型保存在.bin文件扩展名中。但它不可读,如下所示

位:Z 5为氢; |:#պSKA< X ;;]ʋy#ع#G; ##)#; C:}:2; 2#; I标记## N; P +;#:P :U,## W#93Ti ##;唐吉诃德; ; F; #N;:9;к[Q0;Cƹv“;ܚ#U#I7պ+#Ť ;KC 7Y# # # { A4 :ܟ b #;' # ## ; W- $p v “ ; 3u;k ;ꌒ ? F

1 个答案:

答案 0 :(得分:0)

实际上,'binary = True`保存的文件的方式将会和应该看起来:有很多原始二进制数值(浮点)数据,如果被解释为文本,看起来像垃圾。读取该格式的其他代码可以正常使用。

但是,如果您希望 眼睛更容易,请使用binary=False可选参数进行保存。您可能还希望使用不同的文件扩展名(例如.txt)来向其他人(以及您的未来)提示该文件不是原始二进制数据。