Windows批处理脚本从HTML代码中提取数字?

时间:2014-09-02 00:56:10

标签: batch-processing

我正在寻找一些代码来从一些HTML代码中提取一个预期长度为一到四位的数字。我使用cURL拉网页并使用FIND提取我需要的单行信息,但我希望输出更清晰。

以下是我正在处理的HTML行的示例:

constant_text_here 123 constant_text</h2></td>

这个html代码是否会破坏批处理脚本?我对使用Windows批处理代码编写脚本一无所知。该数字可以保留为字符串,但预计在1到4位之间。

2 个答案:

答案 0 :(得分:0)

&lt;和&gt;因为他们习惯于重定向输出而给你带来麻烦。

是否有可能使用VBscript?

从命令行:

C:\>set myvar=constant_text_here 123 constant_text</h2></td>

将输出:

< was unexpected at this time.

但这会奏效:

C:\>set myvar="constant_text_here 123 constant_text</h2></td>"
C:\>echo %myvar%
"constant_text_here 123 constant_text</h2></td>"

C:\>echo [%myvar:~20,4%]
[123 ]

假设您可以在第20位找到您感兴趣的内容

答案 1 :(得分:0)

@ECHO OFF
SETLOCAL
FOR /f "tokens=2" %%a IN (q25614455.txt) DO SET var=%%a
ECHO var=%var%
pause
GOTO :EOF

我使用了一个名为q25614455.txt的文件,其中包含我的测试数据。可悲的是,你没有透露 constant_text_here 实际上是什么,所以磨练程序就在你的管辖区内。 tokens=后面的数字将从文件中提供的文本中选择一个字符串;例如,您的文字为constant text here,您需要将tokens=2更改为tokens=4

也有可能将curl / find包含在程序中并在一行中提取目标数据,但如果没有足够的细节,一个模糊的一般问题最多也可以 得到一个模糊的回应。