Vectorizer对象toArray(),Array太大错误

时间:2017-03-22 21:07:17

标签: python numpy scikit-learn

我创建了预处理数据。现在,我想将其矢量化并将其写在文本文件中。在将矢量化器对象转换为数组时,我收到此错误。有什么可能的解决方案?

var myAlert;

casper.waitForAlert(
    function(response) {
        myAlert = { exists:true, value:response.data }; 
    },
    function() {
        myAlert = { exists:false }; 
    });

casper.then(function() {        
    if ( myAlert.exists ) {
        this.echo( "Alert exists and value is: " + myAlert.value );
    } else {
        this.echo( "Alert doesn't exists" );
    }
});

1 个答案:

答案 0 :(得分:0)

currentAudio.currentTime = 0;创建了一个大型稀疏矩阵vectorizer

featureVector(我通常使用featureVector.toarray())应该从中创建一个密集的(常规featureVector.A)数组。显然所需的尺寸太大了。

你可以打印numpy吗?这应该显示该矩阵的非零项的形状,dtype和数量。我猜它有数百万行和数千列。

所以,即使它确实有效,我怀疑这样一个大数组的repr(featureVector)savetxt csv`文件是否可用。

因此,请确保您了解fmt="%10s %10.3f" would work. Or that正在产生的内容。并重新考虑从结果创建密集数组并保存它的任务。