在Appcelerator Titanium中解析写得不好的HTML

时间:2013-03-28 14:04:58

标签: javascript html-parsing titanium

我正试图从Titanium中的一小段HTML中获取一些值。 我试图使用这个库:https://gist.github.com/bob-sims/4406293在另一个问题(HTML Parser for Titanium Mobile)中回答,但我无法从中得到任何结果。事实上,它根本没有文档,而且我是Titanium的新手可能没有帮助。

html来自此页面:http://www.ctt.pt/feapl_2/app/open/objectSearch/cttObjectSearch.jspx?showResults=true&lang=01&pesqObjecto.objectoId=RD057055721PT并且我正在尝试获取以下值:<tr id="object_RD057055721PT" class="object"><tr id="details_0" class="detailsDiv detailsHide">,这是我写的代码:

var select = require('lib/soupselect').select, htmlparser = require('lib/htmlparser');

var handler = new htmlparser.DefaultHandler(function(err, dom) {
    if (err) {
        alert('Error: ' + err);
    } else {
        Ti.API.info("dom" + dom);
        var body = select(dom, 'meta[property="og:object_RD057055721PT"]');
        rows.forEach(function(body) {
            Ti.API.info(body.children[0].data)
        });

        var rows = select(dom, 'div.row');
        Ti.API.info("rows: " + rows)

        rows.forEach(function(row) {
            Ti.API.info(row.children[0].data)
        });
    }
});

function renderXML() {
    var httpResponse = this.responseText;

    var parser = new htmlparser.Parser(handler);
    parser.parseComplete(httpResponse);
};

var xhr = Ti.Network.createHTTPClient({
    onload : renderXML,
    onerror : errorMessage,
})

xhr.open("GET", "http://www.ctt.pt/feapl_2/app/open/objectSearch/cttObjectSearch.jspx?showResults=true&lang=01&pesqObjecto.objectoId=RD057055721PT");
xhr.send();

但我得到的所有输出都是:

  

dom [object Object],[object Object],[object Object],[object   对象],[对象对象]

1 个答案:

答案 0 :(得分:0)

尝试使用YQL它会更好地解析未知的HTML并提供良好的JSON响应。