在做我认为的哈希操作时需要一些帮助:
我在pandas数据框中有一个字符串值的列,该列用作标识列,其形式为10664084-0-1
我想做的是“ map” /“ hash”(我不知道该怎么称呼),以便每个ID都具有唯一的整数值(总共有345,859个唯一ID)
我还有一列,其格式为HCD2//I/18.000/6////////B15
(来自同一数据集,共有148,881个唯一值),因此我想将“ /”散列到某些唯一的四位字母代码,类似于A到AAAA。
对我来说,在代码和原始值之间来回切换很重要。
这叫做“散列”吗?
我将如何去做?