为什么当我的测试文件包含135时模型的FastText测试仅返回1个示例

时间:2019-04-03 15:20:47

标签: fasttext

我正在尝试在测试文件(test.txt)上测试使用fastText创建的模型(model.bin)。在此测试文件中,我有135个带标签的数据。我期望fastText在此示例数量上测试我的模型,但相反,它仅在1个示例上对其进行测试。这个问题从哪里来?

我已经尝试用另一个模型和另一个测试文件来做这种事情,并且一切都很好。

这就是我测试模型的方式。 model_baby.bin是模型,而test.data.txt是我的测试文件。

./fasttext test model_baby.bin test.data.txt 

N       1

P@1     1

R@1     0.0164

Number of examples: 1

这是我的测试文件的摘录

  

__ label__4.0我喜欢您可以隐藏自己的东西的事实。唯一的不足是,将其固定在中点和底部的皮带可以更好地为您的汽车设计。它有足够的空间,很棒。 __label__5.0这很好地隐藏了我们的iPad。特别是对于那些我们都跳出来并使用洗手间的快速停车站。它可以拉开,折叠,然后将我们所有的东西存放在后座。 __label__3.0

由于我的测试文件中有超过1个带有标签的示例,因此我希望输出“示例数:”至少大于1,但实际值为“ 1”

1 个答案:

答案 0 :(得分:0)

摘自官方文档(https://fasttext.cc/docs/en/supervised-tutorial.html):文本文件的每一行均包含标签列表,后跟相应的文档。所有标签均以__label__前缀开头,这是fastText识别标签或单词的方式。

我不太了解您的摘录。我认为应该是这样的:

__label__4.0 I love the fact you can hide your stuff. Only down is that the straps to hold it at midpoint and bottom could be better designed for your car. It's got plenty of room which is great. 
__label__5.0 This hid our ipad wonderfully. Especially for those quick stops where we all had jump out and use the restroom. It zipped, folded and held all our stuff for the kids in the back seat. 
__label__3.0 ...