我正在读取tsv文件中的两列,并将其添加到数据框中,如下所示。
input_data = pd.read_csv( input_file, header=0, delimiter="\t", quoting=3 )
L= input_data["title"] + '. ' + input_data["description"]
但是,我的某些书名已经有了句号.
,这使得该行成为some title here.. description here
。
因此,我想添加一条if语句以查看标题字符串的末尾是否有句号。如果是,请避免再添加句号。如果否,则添加句号。
即
if title[-1] == '.':
#do not add a fullstop before appending the fullstop
else:
#add the fullstop
我想知道是否可以使用熊猫来做。如果需要,我很乐意提供任何详细信息。
答案 0 :(得分:2)
您可以执行以下操作:
# first remove full stop
input_data['title'] = input_data['title'].str.replace('.','')
# now join with full stop
L= input_data["title"] + '. ' + input_data["description"]