我正在研究从文本中提取关键字的算法,我有一套带有标签(关键字)的科学摘要测试集,我的问题是将正确的标签与标签我的算法进行比较的最佳方法是什么生产 ?
我应该严格比较它们吗? if(correct_tag == result_tag)
...或进行相似性检查?鉴于有时我会得到类似以下内容:
对于同一文件:
**correct_tag** = ["eigenvalues and eigenfunctions in quantum mechanics"]
**result_tag** = ["eigenvalues and eigenfunctions"]
另一份文件:
**correct_tag** = ["cardiovascular system"]
**result_tag** = ["cardiovascular physiology",""cardiovascular system""]
注意:这些标签位于文本标签中,这意味着它们是从文本中提取的
欢迎任何帮助,谢谢,