我正在使用urdu文本在python2.7中工作。我正在做的是读取文本文件并替换“。” “结束标志”它正在替换文件,但它正在开始这个。我想在句子末尾的“ - ”处添加标记。我的代码在这里:
import codecs
import re
import sys
import io
fil = codecs.open("aa.txt","r",encoding="utf-8")
fil1 = codecs.open("a.txt","w",encoding="utf-8")
for line in fil:
for ch in line:
ch = ch.replace(u'۔','</s><s>')
fil1.write(ch)
我原来的数据是:
尝试替换后我的文件是:میراناماحمدہے。 میںپڑھتاہو。
请帮助我或建议我能做些什么。
答案 0 :(得分:-1)
string.replace(s, old, new[, maxreplace])
功能参数
- s:要搜索和替换的字符串。
- old:您要替换的旧子字符串。
- new:您希望放置旧子字符串的新子字符串。
- maxreplace:您希望替换的最大次数 子串。
醇>
你的功能:
ch = ch.replace(u'۔','</s><s>')
字符串在哪里作为参数进行更改?我不明白那里有什么你 试试这个:
ch = ch.replace(ch,'۔','</s><s>')
也许程序从右到左读,但从左到右写 右。