如何在python脚本中更改fasttext api的参数

时间:2018-04-12 13:35:44

标签: python machine-learning nlp fasttext

我们在命令提示符

中运行fasttext commands

我已经克隆了github存储库,例如在我使用的命令中更改网络参数以进行监督学习

 ./fasttext supervised -input FT_Race_data.txt -output race_model  -lr 0.4 -epoch 30 -loss hs

我正在改变lr,epoch和loss。我可以训练和获取所需的输出。

对于python脚本编程,我安装了fasttext库,我尝试了

classifier = fasttext.supervised('FT_Race_data.txt','race_model') 

该模型经过培训但结果并不好,在这种情况下,我没有定义任何参数。所以我尝试了

classifier = fasttext.supervised('FT_Race_data.txt','race_model', 0.4, 30, 'hs')

程序运行没有错误但不提供任何结果。所以我尝试了

classifier = fasttext.supervised(input = 'FT_Race_data.txt',output ='race_model', lr = 0.4,epoch= 30,loss = 'hs')

它给出了一个错误,即fasttext只接受两个参数。

如何在命令提示符中更改python脚本中的参数以微调监督学习?

1 个答案:

答案 0 :(得分:2)

对于将来的引用,表单讨论here,似乎pip install fasttext未安装repo中提供的完整功能。

因此,在https://pypi.python.org/pypi/fasttext中包含最新功能之前,对于具有训练模型和设置参数的功能的python绑定,请遵循以下here概述的安装过程。

git clone https://github.com/facebookresearch/fastText.git
cd fastText
pip install .

然后使用train_supervised函数返回一个模型对象,可以设置不同的参数,如下面的example in that repo所示。

fastText.train_supervised(input, lr=0.1, dim=100, ws=5, epoch=5, minCount=1, minCountLabel=0, minn=0, maxn=0, neg=5, wordNgrams=1, loss='softmax', bucket=2000000, thread=12, lrUpdateRate=100, t=0.0001, label='__label__', verbose=2, pretrainedVectors='')