在熊猫数据框中创建大型nxn共生矩阵

时间:2018-07-12 09:28:29

标签: python pandas dataframe indexing insert

我正在创建一个12,000 x 12,000共现矩阵,为此,我要插入大约500万个值。我的第一个熊猫数据框由500万个单词对和该对出现的次数组成:

数据框 count_data

word_A | word_B |计数

此外,我有一个零填充的12,000 x 12,000共生矩阵作为熊猫数据框,称为 co_matrix 。行名和列名与单词对中的所有单词相对应。现在,我正在寻找一种快速方法,将所有共现计数从第一个数据帧插入到共现数据帧的右2(!)位置。我的代码花费了太多时间,如下所示:

modernizr -c modernizr-config.json

双重赋值可确保共现矩阵的对称性。如何更快地将500万个值插入矩阵?

谢谢!

0 个答案:

没有答案