如何使用INDY获取内部HTML

时间:2011-07-07 09:30:27

标签: html delphi innerhtml indy

我遇到了这个问题:我需要从第presnycas.eu页(到同步)获取时间和日期。日期很好,但我无法得到时间。问题是,当我调用IdHTTP.Get(..)方法时,我得到了页面的HTML,但是时间不见了。像这样:

<div class="boxik"> 
<table style="text-align: left; width: 700px; height: 116px;" border="0" cellpadding="2" cellspacing="0"> 
  <tbody> 
    <tr> 
      <td style="width: 400px;" colspan="1" rowspan="5"> 
            <div class="hodinyhlavni"> 

            <span id="servertime"></span> 
              // This is where the time should be - when viewed with 
              // developer tools in Chrome, it does show the time
              // (picture here http://img684.imageshack.us/img684/166/pagem.png)
            </div> 
      </td> 
      <td style="width: 0px;"> &nbsp;      
           07.07.2011
      </td> 

现在我正在使用一种尴尬的方法 - 我加载一个TWebBrowser,然后调用

Time:=StrToTime(WebBrowser1.OleObject.Document.GetElementByID('servertime').innerhtml);

但是,它很慢,我宁愿根本不使用TWebBrowser。

那么,如何通过调用函数来获取元素的innerhtml?

提前致谢

3 个答案:

答案 0 :(得分:1)

我尝试了你指定的链接(http://presnycas.eu/),从HTML中我可以看到实际的时间是在HTML中的另一个位置返回的,然后在本地使用JavaScript增加,所以你需要如果要同步,请定期“获取”新时间。

在HTML中查找(在HEAD元素内):

<head>
...
<script type="text/javascript">var currenttime = 'July 07, 2011 12:01:26'</script>
...
</head>

答案 1 :(得分:1)

这个答案中最重要的部分是“你需要理解HTML和JavaScript并弄清楚网站是如何工作的”。打开网站,右键单击并执行“显示源”。你会在顶部注意到这一点:

<script type="text/javascript">var currenttime = 'July 07, 2011 11:51:14'</script>

这看起来像时间,在我的情况下,时间是正确的,但没有调整到我的时区。您可以使用Indy轻松获取纯HTML,显然这已经足够了。这个快速代码示例向您展示了如何使用一小段RegEx来获取HTML并解析日期和时间。如果您使用的是Delphi XE,则必须将TPerlRegEx类名称和PerlRegEx单位名称替换为XE所需的名称。如果您使用的是较旧的Delphi,那么这不是不使用RegEx的借口!下载TPerlRegEx,它是免费的,与XE的东西兼容。

program Project29;

{$APPTYPE CONSOLE}

uses
  SysUtils, IdHTTP, PerlRegEx, SysConst;

function ExtractDayTime: TDateTime;
var H: TIdHTTP;
    Response: string;
    RegEx: TPerlRegEx;

    s: string;

    Month, Year, Day, Hour, Minute, Second: Word;
begin
  H := TIdHttp.Create(Nil);
  try
    Response := H.Get('http://presnycas.eu/');
    RegEx := TPerlRegEx.Create;
    try
      RegEx.RegEx := 'var\ currenttime\ \=\ \''(\w+)\ (\d{1,2})\,\ (\d{4})\ (\d{1,2})\:(\d{1,2})\:(\d{1,2})\''';
      RegEx.Subject := Response;
      if RegEx.Match then
        begin

          // Translate month
          s := RegEx.Groups[1];
          if s = SShortMonthNameJan then Month := 1

          else if s = SShortMonthNameFeb then Month := 2
          else if s = SShortMonthNameMar then Month := 3
          else if s = SShortMonthNameApr then Month := 4
          else if s = SShortMonthNameMay then Month := 5
          else if s = SShortMonthNameJun then Month := 6
          else if s = SShortMonthNameJul then Month := 7
          else if s = SShortMonthNameAug then Month := 8
          else if s = SShortMonthNameSep then Month := 9
          else if s = SShortMonthNameOct then Month := 10
          else if s = SShortMonthNameNov then Month := 11
          else if s = SShortMonthNameDec then Month := 12

          else if s = SLongMonthNameJan then Month := 1
          else if s = SLongMonthNameFeb then Month := 2
          else if s = SLongMonthNameMar then Month := 3
          else if s = SLongMonthNameApr then Month := 4
          else if s = SLongMonthNameMay then Month := 5
          else if s = SLongMonthNameJun then Month := 6
          else if s = SLongMonthNameJul then Month := 7
          else if s = SLongMonthNameAug then Month := 8
          else if s = SLongMonthNameSep then Month := 9
          else if s = SLongMonthNameOct then Month := 10
          else if s = SLongMonthNameNov then Month := 11
          else if s = SLongMonthNameDec then Month := 12

          else
            raise Exception.CreateFmt('Don''t know what month is: %s', [s]);

          // Day, Year, Hour, Minute, Second
          Day := StrToInt(RegEx.Groups[2]);
          Year := StrToInt(RegEx.Groups[3]);
          Hour := StrToInt(RegEx.Groups[4]);
          Minute := StrToInt(RegEx.Groups[5]);
          Second := StrToInt(RegEx.Groups[6]);

          Result := EncodeDate(Year, Month, Day) + EncodeTime(Hour, Minute, Second, 0);

        end
      else
        raise Exception.Create('Can''t get time!');
    finally RegEx.Free;
    end;
  finally H.Free;
  end;
end;

begin
  WriteLn(DateTimeToStr(ExtractDayTime));
  ReadLn;
end.

答案 2 :(得分:0)

如何使用indy TidHTTP获取内部html

var
  Form2: TForm2;
  xpto:tmemorystream;
  xx:string;
  implementation

{$R *.fmx}

procedure TForm2.Button1Click(Sender: TObject);

begin
xpto:=tmemorystream.Create;
idhttp1.Get('http://google.com',xpto);
xpto.Position:=0;

end;


procedure TForm2.IdHTTP1WorkEnd(ASender: TObject; AWorkMode: TWorkMode);
var x:string;
begin

SetString(x, PAnsiChar(xpto.Memory), xpto.Size);

memo1.Lines.add(x);
end;

// 对于Android Firemonkey用法,请将Pansichar替换为MarshaledAString