使用HtmlUnit添加和删除元素

时间:2017-02-09 21:16:13

标签: java html web-scraping htmlunit

好吧,我想从我的学校网站上拿出一张桌子,其中包含当天的日程安排。表根据您选择的类更改,因此它使用javascript命令检查选择了哪个类。我发现它基于该网站的HTML代码中的列表:

<option selected="selected" value="52">1</option>
<option value="53">2</option>
<option value="54">3</option>
<option value="1">ז - 1</option>
<option value="2">ז - 2</option>
<option value="3">ז - 3</option>
<option value="4">ז - 4</option>
<option value="5">ז - 5</option>
<option value="6">ז - 6</option>
<option value="57">ז - 7</option>
<option value="9">ח - 1</option>
<option value="10">ח - 2</option>
<option value="11">ח - 3</option>
<option value="12">ח - 4</option>
<option value="13">ח - 5</option>
<option value="14">ח - 6</option>
<option value="15">ח - 7</option>
<option value="17">ט - 1</option>
<option value="18">ט - 2</option>
<option value="19">ט - 3</option>
<option value="20">ט - 4</option>
<option value="21">ט - 5</option>
<option value="22">ט - 6</option>
<option value="23">ט - 7</option>
<option value="26">י - 1</option>
<option value="27">י - 2</option>
<option value="28">י - 3</option>
<option value="29">י - 4</option>
<option value="30">י - 5</option>
<option value="31">י - 6</option>
<option value="32">יא - 1</option>
<option value="33">יא - 2</option>
<option value="34">יא - 3</option>
<option value="35">יא - 4</option>
<option value="36">יא - 5</option>
<option value="37">יא - 6</option>
<option value="38">יב - 1</option>
<option value="39">יב - 2</option>
<option value="40">יב - 3</option>
<option value="41">יב - 4</option>
<option value="42">יב - 5</option>
<option value="43">יב - 6</option>
<option value="56">יב - 7</option>
<option value="49">שכבה ז'</option>
<option value="50">שכבה ח'</option>
<option value="51">שכבה ט'</option>
<option value="48">שכבה י'</option>
<option value="46">שכבה י&quot;א</option>
<option value="47">שכבה י&quot;ב</option>

如您所见,所选选项还有一个名为<option selected="selected" value="52">1</option>的附加元素selected 基本上,我只想从一个选项元素中删除该selected元素,并将其移动到另一个选项元素,该元素将是我想要选择的类。

1 个答案:

答案 0 :(得分:1)

此选择&#39;事情没什么特别的;这是html的工作方式(https://developer.mozilla.org/en-US/docs/Web/HTML/Element/select)。顺便说一句,如果你想抓取网页,一些Html的基本知识可能会有所帮助: - )。

关于你的选择:

  • 你必须在页面中找到select控件 - 通常你有一个HtmlPage对象,你必须使用HtmlUnit(http://htmlunit.sourceforge.net/gettingStarted.html)提供的一种选择方法来找到select元素(不知道你的代码我不能更具体)
  • 然后在您要选择的选择内找到选项(HtmlOption)
  • 最后为该选项调用HtmlOption #setSelected(true)