根据行的内容为数据框创建行ID

时间:2018-09-27 12:58:26

标签: python-3.x pandas dataframe

问题:基于行的内容创建数据框行ID的最佳方法是什么?

我有两个分别称为A和B的数据框。我正在寻找一种聪明的方法来为两个数据框中的行创建ID。我知道有FR个可以为数据框创建外部ID。但是,我希望有一种方法,如果两行相同,则将为两行创建完全相同的id。也就是说,如果数据帧A和B看起来像这样:

         A
22|'John' |'Smith'
42|'Anne' |'Baker'
22|'John' |'Smith'
46|'Peter'|'Jackson'

         B
27|'Jack' |'Griffin'
52|'Sarah'|'Portman'
22|'John' |'Smith'
46|'Peter'|'Jackson'

如果希望能够创建这样的ID:

          A
id         
98  |22|'John' |'Smith'
746 |42|'Anne' |'Baker'
98  |22|'John' |'Smith'
56  |46|'Peter'|'Jackson'

          B
id         
478 | 27 | 'Jack'  | 'Griffin'
644 | 52 | 'Sarah' | 'Portman'
98  | 22 | 'John'  | 'Smith'
56  | 46 | 'Peter' | 'Jackson'

此外,我希望将来能够为新的数据框创建类似的ID。

我想我可以通过在数据帧中创建一个新的“ id”列并将该新列设置为其他列中的值来做到这一点,但是我认为这不是很优雅。如果数据框中的列数很大,或者单元格包含某些数据类型(例如,浮点数很多的浮点数),则ID将非常长。

0 个答案:

没有答案