我有一个由['RC12_4', 'RC100_', 'RC101_', 'RC102_', 'RC103_', 'RC104_', 'RC109_', 'RC111_', 'RC114_', 'RC115_', 'RC116_', 'RC117_', 'RC118_', 'RC119_', 'RC120_', 'RC121_', 'RC122_', 'RC125_', 'RC126_', 'RC129_']
和sorted(listName, key=lambda x: x.split('_')[0])
Is there a way to modify this script so that it sorts by the first item after RC and before the underscore? Or is there an easier way?
组成的sklearn管道,安装在多标签训练数据集上。然后,当我在样本上使用ELI5 TfidfVectorizer
(使用管道中的矢量化器和分类器)时,与在同一样本上使用SGDClassifier(loss='log')
时,得到的概率不同。为什么会这样?