我正在尝试清除此数据框中的“名称”列。它具有重复的字符,所有字符都遵循相同的模式。请查看下面的图片以供参考。
答案 0 :(得分:0)
重复名称字段,因此只需将字符串减半
x='namename'
x[:len(x)//2]
'name'
答案 1 :(得分:0)
您可以像这样提取每一行的字符串的后半部分:
df["name"]=df["name"].apply(lambda x:x[:int(len(x)/2)])
答案 2 :(得分:0)
您应该解决根本的问题,而不要这样做。
毫无防备,要做的就是将字符串缩短一半
import math
def half_str(name: str):
return name[:math.ceil(len(name)/2)]
以下是您数据库中的一些示例:
print(half_str("John SmithJohn Smith")) # "John Smith"
print(half_str("Ty GoodenTyGooden")) # "Ty Gooden"