Question

我需要使用cmd（Windows命令行）执行以下操作。

我有一个名为DDD.CLI026.WK0933.DDDMR45.001.head的文件。

文件中的数据如下（在一个长行中）

HEAD HEALTHDMD Weekly  DDD.CLI026 Centocor  W200908021012 
TRAIL0101 000000000581 00000CKSUM00000223680

我需要从000000000581中提取581 并将其复制到另一个文件IMS_FILE_to_LND.par中，使用Windows命令行或DOS。

我该如何解决？

Answer 1

Irveen，对于输入文件（一行），您可以拥有以下文件：

infile.txt (the inputfile on one line):
    HEAD HEALTHDMD Weekly  DDD.CLI026 Centocor  W200908021012
     TRAIL0101 000000000581 00000CKSUM00000223680

pre.txt (the first half of your desired file):
    [WCPIT_BIO_EDW.WF:w_DDDMD_LNDG_IMS_NONRET_SALES]
    $$Cust_RowCount=72648
    $$Sales_RowCount=5235998
    $$OuletChangeLog_RowCount=931

post.txt (the second half of your desired file):
    $$Control_RowCount=4495
    $$Outl_Subcat_RowCount=105
    $$Fac_Subcat_RowCount=149

go.cmd (the command file to create your desired file):
    @echo off
    setlocal enableextensions enabledelayedexpansion
    for /f "tokens=8" %%i in (infile.txt) do (
        set num=%%i
    :loop1
        if "!num!"=="0" goto :skip1
        if not "!num:~0,1!"=="0" goto :skip1
        set num=!num:~1!
        goto :loop1
    :skip1
        type pre.txt >outfile.txt
        echo $$DRM45_RowCount=!num!>>outfile.txt
        type post.txt >>outfile.txt
    )
    endlocal

这会生成文件：

outfile.txt:
    [WCPIT_BIO_EDW.WF:w_DDDMD_LNDG_IMS_NONRET_SALES]
    $$Cust_RowCount=72648
    $$Sales_RowCount=5235998
    $$OuletChangeLog_RowCount=931
    $$DRM45_RowCount=581
    $$Control_RowCount=4495
    $$Outl_Subcat_RowCount=105
    $$Fac_Subcat_RowCount=149

这是我想从这一系列问题中得到的。

作为解释，for循环处理你的一行，提取8 ^th字段（000 ... 00581）。循环跳过部分只是删除前导零，直到你自己有一个0或一个实数（Windows将前导零的数字视为八进制，这对我们来说没有好处。）

提取数字后，您只需从前后位以及要修改的行构建文件。

我知道，它比我之前提供的awk解决方案更像是一个问题，但是它可以在Windows中完成这一操作，而无需添加第三方软件（您在其他问题中指出这不是一个选项））。

Update 1：这是一个根据要求使用单个模板文件创建输出文件的版本。模板文件必须包含以"pre:"或"post:"开头的行，以指示它们是在要插入的行之前还是之后。没有标记的行根本不使用，因此您可以在心脏的内容中插入空行或注释。所以你的文件是：

pre:[WCPIT_BIO_EDW.WF:w_DDDMD_LNDG_IMS_NONRET_SALES]
pre:$$Cust_RowCount=72648
pre:$$Sales_RowCount=5235998
pre:$$OuletChangeLog_RowCount=931

post:$$Control_RowCount=4495
post:$$Outl_Subcat_RowCount=105
post:$$Fac_Subcat_RowCount=149

这是命令脚本，它将为您提供所需的内容。我只是用一个技巧来临时创建文件前后文件，以尽量减少所需的更改。

@echo off
setlocal enableextensions enabledelayedexpansion
del /q /q pre.txt post.txt >nul: 2>nul:
for /f "delims=" %%j in (template.txt) do (
    set ln=%%j
    if "!ln:~0,4!"=="pre:" echo !ln:~4!>>pre.txt
    if "!ln:~0,5!"=="post:" echo !ln:~5!>>post.txt
)
for /f "tokens=8" %%i in (infile.txt) do (
    set num=%%i
:loop1
    if not "!num!"=="0" (
        if "!num:~0,1!"=="0" (
            set num=!num:~1!
            goto :loop1
        )
    )
)
type pre.txt >outfile.txt
echo $$DRM45_RowCount=!num!>>outfile.txt
type post.txt >>outfile.txt
del /q /q pre.txt post.txt >nul: 2>nul:
endlocal

输出：

[WCPIT_BIO_EDW.WF:w_DDDMD_LNDG_IMS_NONRET_SALES]
$$Cust_RowCount=72648
$$Sales_RowCount=5235998
$$OuletChangeLog_RowCount=931
$$DRM45_RowCount=581
$$Control_RowCount=4495
$$Outl_Subcat_RowCount=105
$$Fac_Subcat_RowCount=149

就像上面的前/后解决方案一样，但满足您的新要求。

更新2：如果你能说服他们去购买Cygwin解决方案，这就是你所需要的：

x=$(expr 0 + $(awk '{print $8}' infile))
sed "s/^\$\$DRM45_RowCount=.*$/\$\$DRM45_RowCount=$x/" cfgfile >cfgfile_new

cfgfile包含：

[WCPIT_BIO_EDW.WF:w_DDDMD_LNDG_IMS_NONRET_SALES]
$$Cust_RowCount=72648
$$Sales_RowCount=5235998
$$OuletChangeLog_RowCount=931
$$DRM45_RowCount=whatever
$$Control_RowCount=4495
$$Outl_Subcat_RowCount=105
$$Fac_Subcat_RowCount=149

和infile包含（更短但相同数量的字段）：

HD HLTHDMD Wkly DDD.CLI Cntcr  W200908021012 TRAIL0101 00581 00000CKSUM680

您获得以下cfgfile_new：

[WCPIT_BIO_EDW.WF:w_DDDMD_LNDG_IMS_NONRET_SALES]
$$Cust_RowCount=72648
$$Sales_RowCount=5235998
$$OuletChangeLog_RowCount=931
$$DRM45_RowCount=581
$$Control_RowCount=4495
$$Outl_Subcat_RowCount=105
$$Fac_Subcat_RowCount=149

瞧！这么简单多了。随意使用cmd脚本和Cygwin脚本来说服您的管理层他们应该使用更好的工具： - ）

Answer 2

您可以安装Cygwin吗？或者使用Microsoft PowerShell？如果是，那么你将拥有更强大的工具（例如正则表达式）来做到这一点。

如何使用Windows批处理文件从文本文件中提取数字？

2 个答案: