我有一个包含两列的数据框,在一列中有一个4字符的字母数字代码(PDB),而另一列中有一个包含字母(链)的字符串,如下所示:
PDB Chains
0 4PKB A
1 6AZU ABCD
2 5WHR CD
我想要的是这样的列表:
list = ['4PKBA', '6AZUA', '6AZUB', '6AZUC', '6AZUD', '5WHRC', '5WHRD']
我尝试遍历行,但是我在每个PDB代码中附加了Chains中的所有字符,例如:
list = ['4PKBA', '4PKBA', '4PKBB', '4PKBC', '4PKBD', '4PKBC', '4PKBD', ...]
我该如何解决? 谢谢!