问题:基于行的内容创建数据框行ID的最佳方法是什么?
我有两个分别称为A和B的数据框。我正在寻找一种聪明的方法来为两个数据框中的行创建ID。我知道有FR个可以为数据框创建外部ID。但是,我希望有一种方法,如果两行相同,则将为两行创建完全相同的id。也就是说,如果数据帧A和B看起来像这样:
A
22|'John' |'Smith'
42|'Anne' |'Baker'
22|'John' |'Smith'
46|'Peter'|'Jackson'
B
27|'Jack' |'Griffin'
52|'Sarah'|'Portman'
22|'John' |'Smith'
46|'Peter'|'Jackson'
如果希望能够创建这样的ID:
A
id
98 |22|'John' |'Smith'
746 |42|'Anne' |'Baker'
98 |22|'John' |'Smith'
56 |46|'Peter'|'Jackson'
B
id
478 | 27 | 'Jack' | 'Griffin'
644 | 52 | 'Sarah' | 'Portman'
98 | 22 | 'John' | 'Smith'
56 | 46 | 'Peter' | 'Jackson'
此外,我希望将来能够为新的数据框创建类似的ID。
我想我可以通过在数据帧中创建一个新的“ id”列并将该新列设置为其他列中的值来做到这一点,但是我认为这不是很优雅。如果数据框中的列数很大,或者单元格包含某些数据类型(例如,浮点数很多的浮点数),则ID将非常长。