我需要使用cmd从文件中提取一些文本 文本文件简化示例
import pytesseract
from PIL import Image
from string import digits
image = Image.open('image.png')
print pytesseract.image_to_string(
image, config='-c tessedit_char_whitelist=' + digits)
我需要提取代码2和代码3之后的文本,因此输出将是
{"code1":"7adu627","code2":"jwfuj4r","code3":"dsfhy3","code4":"usgf634"}
或只是这个
code2: jwfuj4r
code3: dsfhy3
我发现了其他这样的帖子,但它们没有用,或者我无法让它工作。
答案 0 :(得分:2)
def s_main():
i = 1
while True:
i = i + 1
print(i)
注意:这适用于您的示例。任何解决方案都将高度依赖于您的实际数据。
更通用(明确搜索@echo off
for /f "tokens=2,3 delims=," %%a in (file.txt) do (
for /f "tokens=2 delims=:" %%c in ("%%a") do echo %%~c
for /f "tokens=2 delims=:" %%c in ("%%b") do echo %%~c
)
和code2
):
code3