使用节点连接到网站

时间:2011-07-12 13:10:23

标签: java dom jtidy

我正在尝试编写一个连接到网站的程序,获取源代码,使用节点查找<body>标记。在该标记内有三个“文本字段”,我想输入值,并将其流回网站。

我到目前为止找到<body>标签,但现在我实际上一无所知。

try
{
  Tidy tidy = new Tidy();
  ByteArrayOutputStream baos = new ByteArrayOutputStream();
  Document docx = tidy.parseDOM(new URL("http://www.clubvip.co.za/Login.aspx").openStream(), baos);
  Node n = docx.getFirstChild();
  System.out.println(n.getNodeName());
  n = n.getFirstChild();

  System.out.println(n.getNodeName());
  while (n != null)
  {                     
    while (n != null) {
    if (n.getNodeName() != "body") {                        
        n = n.getNextSibling();                         
        System.out.println(n.getNodeName());

1 个答案:

答案 0 :(得分:0)

您实际上可以使用

直接获取这些标签
docx.getElementsByTagName("tagname")

请参阅文档here

这将返回您可以迭代的NodeList。