在具有大量Nan的熊猫数据帧上执行SVD

时间:2020-05-27 11:08:28

标签: python numpy scipy linear-algebra svd

我具有熊猫数据框(NxK)形状,其中N代表行数(每行是一个用户),K代表用户要素的数量。这个数据帧非常稀疏,我想为其行查找密集的编码。 我看到SciPy有一个稀疏的SVD方法,但是它要求我将数据帧转换为这个let data = { "list": [ { "deviceId": "2a-d539-4031-9bfc-4a42f2f765cf", "versions": [ { "id": "764c20-a213-9235f4b553b3", "createdTime": 1590361208034, "files": [ { "fileType": "VLAN" }, { "fileType": "STARTUPCONFIG", } ], "startupRunningStatus": "OUT_OF_SYNC", "createdBy": "SCHEDULED" }, { "id": "9bd33-a45a-ed2fefc46931", "createdTime": 1589972337717, "files": [ { "fileType": "VLAN", }, { "fileType": "STARTUPCONFIG", }, { "fileType": "RUNNINGCONFIG", } ], "startupRunningStatus": "IN_SYNC", "createdBy": "SCHEDULED_FIRST_TIME" } ] } ] }; let versionsData = /*response.*/data.list[0].versions; versionsData = versionsData.filter(versions => { return versions.files.filter(m => { return m.fileType == 'RUNNINGCONFIG' || m.fileType == 'STARTUPCONFIG'; }).length == 2; }); console.log(versionsData);

我的问题是:

  1. 是否有比SciPy函数更好的替代方法?
  2. 还有一个CSC_matrix函数,但是可能需要我填写NaN值。用0填充这些值是个好主意吗?

0 个答案:

没有答案