我已经使用约5000个我自己的域特定图像以及约30个层次和非层次标签构建了一个Azure自定义视觉模型。
对于这个特殊的多标签分类问题,我不确定如何最好地组织我的标签动物园。最好的方法(例如,参见https://www.researchgate.net/publication/225379571_A_Tutorial_on_Multi-label_Classification_Techniques和https://towardsdatascience.com/journey-to-the-center-of-multi-label-classification-384c40229bff)必须取决于Custom Vision的内部工作原理,这是未记录的*。例如考虑
Image Document_Description
1 Barclays Bank Statement
2 HSBC Bank Statement
3 Joe Bloggs' Curriculum Vitae
考虑到Custom Vision使用的(也许)未知的建模方案及其对任意标签的支持,哪种标签分类法将是最有效的(就训练计算和模型性能而言)?
1. Hierarchical (choose one from each level):
IsCV | IsBankStatement | IsOther | ...
|
Barclays | HSBC | ...
2. Non-hierarchical:
IsCV, IsBankStatementBarclays, IsBankStatementHSBC, IsOther, ...
3. Both
4. Some other scheme perhaps informed by insider information?
奖金::您将如何使用可用的性能指标(或V3.0 API)来衡量两种竞争性分类法的性能(只需最少的培训计算/成本)?
*我为这个绝望的问题表示歉意。在投票关闭它之前,请让Azure Cognitive Services有时间发表评论,因为这似乎是他们唯一能够提供意见的论坛,并且他们确实通过SO询问。谢谢。
答案 0 :(得分:0)
我认为自定义愿景目前仅支持非分层标签,但您可以在https://cognitive.uservoice.com/forums/598141-custom-vision-service此处提交建议