标签: weka arff metadatatype
我有大约10000个txt文件。每个txt文件都包含以下形式的视频元数据:
Title: ...\n Video Id: ...\n Url: ...\n Duration: ...\n
和其他属性
我想在weka中使用带有k均值的元数据对这些视频进行聚类,但我有问题预处理它们。我用textDirectoryLoader加载它们,但我希望属性为Title,Photo Id,Url,Duration等。有没有办法在arff文件中以这种形式提供数据?