如何在opennlp中查看.bin文件的内容

时间:2014-10-01 11:37:57

标签: bin opennlp

我正在尝试在我正在工作的项目中使用OpenNLP,而且我对它很新。我尝试使用命名实体识别和http://opennlp.sourceforge.net/models-1.5/提供的培训数据 但是我希望看到已经使用过的训练数据。即实际打开.bin文件并以英文显示其内容。有人可以指出我正确的方向。 我曾尝试使用UltraISO来读取.bin文件,但我没有成功。 PL帮助!! Thanx:)

2 个答案:

答案 0 :(得分:0)

使用Unix file命令查找文件类型,例如file en-token.bin。对于大多数OpenNLP .bin文件,它会告诉您这些只是ZIP文件。

答案 1 :(得分:0)

bin文件实际上是一个序列化java对象的字节,表示名为NameFinderME的TokenNameFinder实现(ME表示最大熵,这是OpenNLP中使用的主要多项逻辑回归(ish)算法)。通过对此文件执行任何操作,您将无法查看训练数据。 更正:它不是名称查找器,它是序列化的namefinderMODEL。