大熊猫数据框中的“散列”或“映射”列

时间:2020-06-10 16:10:32

标签: python-3.x pandas dictionary hash

在做我认为的哈希操作时需要一些帮助:

我在pandas数据框中有一个字符串值的列,该列用作标识列,其形式为10664084-0-1

我想做的是“ map” /“ hash”(我不知道该怎么称呼),以便每个ID都具有唯一的整数值(总共有345,859个唯一ID)

我还有一列,其格式为HCD2//I/18.000/6////////B15(来自同一数据集,共有148,881个唯一值),因此我想将“ /”散列到某些唯一的四位字母代码,类似于A到AAAA。

对我来说,在代码和原始值之间来回切换很重要。

这叫做“散列”吗?

我将如何去做?

0 个答案:

没有答案