Question

我需要使用cmd从文件中提取一些文本文本文件简化示例

import pytesseract
from PIL import Image
from string import digits

image = Image.open('image.png')
print pytesseract.image_to_string(
    image, config='-c tessedit_char_whitelist=' + digits)

我需要提取代码2和代码3之后的文本，因此输出将是

{"code1":"7adu627","code2":"jwfuj4r","code3":"dsfhy3","code4":"usgf634"}

或只是这个

code2: jwfuj4r
code3: dsfhy3

我发现了其他这样的帖子，但它们没有用，或者我无法让它工作。

Answer 1

def s_main():
    i = 1
    while True:
        i = i + 1
        print(i)

注意：这适用于您的示例。任何解决方案都将高度依赖于您的实际数据。

更通用（明确搜索@echo off for /f "tokens=2,3 delims=," %%a in (file.txt) do ( for /f "tokens=2 delims=:" %%c in ("%%a") do echo %%~c for /f "tokens=2 delims=:" %%c in ("%%b") do echo %%~c )和code2）：

code3

批处理文件 - 从.txt文件中提取特定文本

1 个答案: