用python中的<s>替换“。”

时间:2017-11-05 11:32:25

标签: python nlp urdu

我正在使用urdu文本在python2.7中工作。我正在做的是读取文本文件并替换“。” “结束标志”它正在替换文件,但它正在开始这个。我想在句子末尾的“ - ”处添加标记。我的代码在这里:

import codecs
import re
import sys
import io

fil = codecs.open("aa.txt","r",encoding="utf-8")
fil1 = codecs.open("a.txt","w",encoding="utf-8")
for line in fil:
    for ch in line:
        ch = ch.replace(u'۔','</s><s>')
        fil1.write(ch)

我原来的数据是:

  

میراناماحمدہے。 میںپڑھتاہو。

尝试替换后我的文件是:

enter image description here

请帮助我或建议我能做些什么。

1 个答案:

答案 0 :(得分:-1)

string.replace(s, old, new[, maxreplace])
  

功能参数

     
      
  1. s:要搜索和替换的字符串。
  2.   
  3. old:您要替换的旧子字符串。
  4.   
  5. new:您希望放置旧子字符串的新子字符串。
  6.   
  7. maxreplace:您希望替换的最大次数   子串。
  8.   

你的功能:

ch = ch.replace(u'۔','</s><s>')

字符串在哪里作为参数进行更改?我不明白那里有什么 试试这个:

ch = ch.replace(ch,'۔','</s><s>')
  

也许程序从右到左读,但从左到右写   右。