标签: xml classification svm document-classification feature-selection
是否可以使用SVM学习输入“特征矩阵”而不是“特征向量”的训练样本?我需要通过将每个文档表示为特征矩阵来对XML文档进行分类。通常,特征向量用于训练SVM以进行文本分类。但是,将XML文档表示为特征向量可能会导致结构信息丢失!
提前致谢!
答案 0 :(得分:1)
标准做法是通过“栅格化”矩阵来创建“长矢量”。
最终,SVM会分解为线条或超平面,而不是多边形。