如何使用Windows批处理文件从文本文件中提取数字?

时间:2009-09-15 09:31:59

标签: windows command-line cmd

我需要使用cmd(Windows命令行)执行以下操作。

我有一个名为DDD.CLI026.WK0933.DDDMR45.001.head的文件。

文件中的数据如下(在一个长行中)

HEAD HEALTHDMD Weekly  DDD.CLI026 Centocor  W200908021012 
TRAIL0101 000000000581 00000CKSUM00000223680

我需要从000000000581中提取581 并将其复制到另一个文件IMS_FILE_to_LND.par中, 使用Windows命令行或DOS。

我该如何解决?

2 个答案:

答案 0 :(得分:4)

Irveen,对于输入文件(一行),您可以拥有以下文件:

infile.txt (the inputfile on one line):
    HEAD HEALTHDMD Weekly  DDD.CLI026 Centocor  W200908021012
     TRAIL0101 000000000581 00000CKSUM00000223680

pre.txt (the first half of your desired file):
    [WCPIT_BIO_EDW.WF:w_DDDMD_LNDG_IMS_NONRET_SALES]
    $$Cust_RowCount=72648
    $$Sales_RowCount=5235998
    $$OuletChangeLog_RowCount=931

post.txt (the second half of your desired file):
    $$Control_RowCount=4495
    $$Outl_Subcat_RowCount=105
    $$Fac_Subcat_RowCount=149

go.cmd (the command file to create your desired file):
    @echo off
    setlocal enableextensions enabledelayedexpansion
    for /f "tokens=8" %%i in (infile.txt) do (
        set num=%%i
    :loop1
        if "!num!"=="0" goto :skip1
        if not "!num:~0,1!"=="0" goto :skip1
        set num=!num:~1!
        goto :loop1
    :skip1
        type pre.txt >outfile.txt
        echo $$DRM45_RowCount=!num!>>outfile.txt
        type post.txt >>outfile.txt
    )
    endlocal

这会生成文件:

outfile.txt:
    [WCPIT_BIO_EDW.WF:w_DDDMD_LNDG_IMS_NONRET_SALES]
    $$Cust_RowCount=72648
    $$Sales_RowCount=5235998
    $$OuletChangeLog_RowCount=931
    $$DRM45_RowCount=581
    $$Control_RowCount=4495
    $$Outl_Subcat_RowCount=105
    $$Fac_Subcat_RowCount=149

这是我想从这一系列问题中得到的。

作为解释,for循环处理你的一行,提取8 th 字段(000 ... 00581)。循环跳过部分只是删除前导零,直到你自己有一个0或一个实数(Windows将前导零的数字视为八进制,这对我们来说没有好处。)

提取数字后,您只需从前后位以及要修改的行构建文件。

我知道,它比我之前提供的awk解决方案更像是一个问题,但是它可以在Windows中完成这一操作,而无需添加第三方软件(您在其他问题中指出这不是一个选项) )。

Update 1:这是一个根据要求使用单个模板文件创建输出文件的版本。模板文件必须包含以"pre:""post:"开头的行,以指示它们是在要插入的行之前还是之后。没有标记的行根本不使用,因此您可以在心脏的内容中插入空行或注释。所以你的文件是:

pre:[WCPIT_BIO_EDW.WF:w_DDDMD_LNDG_IMS_NONRET_SALES]
pre:$$Cust_RowCount=72648
pre:$$Sales_RowCount=5235998
pre:$$OuletChangeLog_RowCount=931

post:$$Control_RowCount=4495
post:$$Outl_Subcat_RowCount=105
post:$$Fac_Subcat_RowCount=149

这是命令脚本,它将为您提供所需的内容。我只是用一个技巧来临时创建文件前后文件,以尽量减少所需的更改。

@echo off
setlocal enableextensions enabledelayedexpansion
del /q /q pre.txt post.txt >nul: 2>nul:
for /f "delims=" %%j in (template.txt) do (
    set ln=%%j
    if "!ln:~0,4!"=="pre:" echo !ln:~4!>>pre.txt
    if "!ln:~0,5!"=="post:" echo !ln:~5!>>post.txt
)
for /f "tokens=8" %%i in (infile.txt) do (
    set num=%%i
:loop1
    if not "!num!"=="0" (
        if "!num:~0,1!"=="0" (
            set num=!num:~1!
            goto :loop1
        )
    )
)
type pre.txt >outfile.txt
echo $$DRM45_RowCount=!num!>>outfile.txt
type post.txt >>outfile.txt
del /q /q pre.txt post.txt >nul: 2>nul:
endlocal

输出:

[WCPIT_BIO_EDW.WF:w_DDDMD_LNDG_IMS_NONRET_SALES]
$$Cust_RowCount=72648
$$Sales_RowCount=5235998
$$OuletChangeLog_RowCount=931
$$DRM45_RowCount=581
$$Control_RowCount=4495
$$Outl_Subcat_RowCount=105
$$Fac_Subcat_RowCount=149

就像上面的前/后解决方案一样,但满足您的新要求。

更新2:如果你能说服他们去购买Cygwin解决方案,这就是你所需要的:

x=$(expr 0 + $(awk '{print $8}' infile))
sed "s/^\$\$DRM45_RowCount=.*$/\$\$DRM45_RowCount=$x/" cfgfile >cfgfile_new

cfgfile包含:

[WCPIT_BIO_EDW.WF:w_DDDMD_LNDG_IMS_NONRET_SALES]
$$Cust_RowCount=72648
$$Sales_RowCount=5235998
$$OuletChangeLog_RowCount=931
$$DRM45_RowCount=whatever
$$Control_RowCount=4495
$$Outl_Subcat_RowCount=105
$$Fac_Subcat_RowCount=149

infile包含(更短但相同数量的字段):

HD HLTHDMD Wkly DDD.CLI Cntcr  W200908021012 TRAIL0101 00581 00000CKSUM680

您获得以下cfgfile_new

[WCPIT_BIO_EDW.WF:w_DDDMD_LNDG_IMS_NONRET_SALES]
$$Cust_RowCount=72648
$$Sales_RowCount=5235998
$$OuletChangeLog_RowCount=931
$$DRM45_RowCount=581
$$Control_RowCount=4495
$$Outl_Subcat_RowCount=105
$$Fac_Subcat_RowCount=149

瞧!这么简单多了。随意使用cmd脚本和Cygwin脚本来说服您的管理层他们应该使用更好的工具: - )

答案 1 :(得分:0)

您可以安装Cygwin吗?或者使用Microsoft PowerShell? 如果是,那么你将拥有更强大的工具(例如正则表达式)来做到这一点。