我正在使用tesseract库,希望图像中的文本在一行中,而没有新行("\n"
)。
我尝试使用variable.replace("\n"," ")
,但是它不起作用。它只是给了我相同的多线响应。
下面是我的代码:
img = Image.open('maaan.jpg')
pytesseract.pytesseract.tesseract_cmd = 'C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe'
kt = pytesseract.image_to_string(img,lang='eng')
kt.replace("\n", " ")
print(kt)
感谢帮忙:D
答案 0 :(得分:1)
将\n
写为raw string
,例如:
my_variable = my_variable.replace(r"\n"," " )
尝试:
print(kt.replace(r"\n"," ")
或者,
kt = kt.replace(r"\n", " ")
print(kt)
答案 1 :(得分:0)
kt.replace("\r", "\t")
访问此链接,它具有更多说明:python convert multiline to single line