Jsoup element.class.class selcet方法返回null

时间:2016-03-17 18:45:36

标签: java null css-selectors html-parsing jsoup

我试图访问<button>元素中的<form>元素。

<form action="search.php" method="post" class="form-inline">
            <div class="form-group">
                <label for="value"><span class="text-uppercase">Lyrics Search:</span></label>
                <input type="text" name="value" class="form-control input-sm">
            </div>
            <div class="form-group">
                <select name="field" class="form-control input-sm">
                    <option value="artist" >Artist</option>
                    <option value="title" >Title</option>
                    <option value="body"  >Body</option>
                </select>
                <button type="submit" class="btn btn-primary btn-sm">Submit</button>
            </div>
        </form> 

现在<button>元素在2 HTML个类中,我知道我需要在select()方法中连接这些类。 不知何故,我的代码在null方法之后返回select()

mycode的:

HtmlPage htmlPage = new HtmlPage(Jsoup.connect("http://www.lyricsplanet.com/").get());

            // Get to <div class="form-group">
            Element searchFormElement = htmlPage.getHtmlDocument().select("div.form-group").first();
searchFormElement.attr("name", searchedLyrics); // Setting the value of name to the searched lyrics.

            // Getting to <button type="submit" class="btn btn-primary btn-sm">Submit</button>
            Element buttonElement = htmlPage.getHtmlDocument().select("button.btn btn-primary btn-sm.form-inline").first();
            System.out.println(buttonElement.html());

In - select("button.btn btn-primary btn-sm.form-inline").first();我尝试使用It的两个类来访问<button>元素。

那么我做错了什么?

修改 我刚注意到那里有3个! <button>元素的类。那更加凌乱。

2 个答案:

答案 0 :(得分:1)

要使用多个类搜索一个元素,您必须对多个选择器进行分组,例如select("button.btn, button.btn-primary, button.btn-sm")

有关详细信息,请参阅选择器组合部分中的http://jsoup.org/cookbook/extracting-data/selector-syntax

答案 1 :(得分:1)

我从来没有听说过Jsoup中有一个名为HtmlPage的类。如果调用Jsoup.connect(...);

,则应使用将返回的Document类

您可以尝试以下代码:

Document document = Jsoup.connect("http://www.lyricsplanet.com/").get(); // Just connect
Element formElement = document.select("div#alphabet > form").first(); // Search for form
formElement.select("input[name=value]").val(yourSearchValue); // Set your search value
Element submitButton = formElement.select("button[type=submit]").first(); // Then search in form for submit button, otherwise your selector could find another submit button first

HTML表单元素(搜索字段和提交按钮)没有可以使用的标识符。唯一的方法是使用这些特定的css选择器。

编辑: 您想在之后提交表格吗?然后,您不必搜索提交按钮。您可以在设置搜索值后提交表单。请尝试以下代码:

Document document = Jsoup.connect("http://www.lyricsplanet.com/").get();
FormElement formElement = document.select("div#alphabet > form").forms().get(0); // Use FormElement instead of Element
formElement.select("input[name=value]").val(yourSearchValue);
Document searchResult = formElement.submit().post(); // Do anything you want with the search result page/html