雅虎财务查询速度

时间:2015-04-14 16:43:37

标签: mysql node.js yahoo-finance download-speed

我目前正在开展一个项目,该项目涉及查询雅虎财务中的许多不同的股票代码。瓶颈是从雅虎获取数据,所以我想知道是否有办法加快速度。

如果我使用多台机器查询然后汇总数据,那会有帮助吗?我只有一台物理机器;我该怎么做呢?

谢谢!

编辑:目前,我使用Node.js,yahoo-finance和Q.deferred向雅虎询问历史数据。然后,一旦所有承诺得到满足(对于每个股票代码),我都会执行Q.all()来保存数据。

    var data = [];
    tickers = ["goog", "aapl", ...];
    ...
    Q.all(_.map(tickers, function(symbol) { 
        return getYahooPromise(symbol);
     }))
    .done( function() { persistData(data) });

getYahooPromise检索股票代码的数据并将其推送到数据数组中。一旦所有承诺都得到解决,数据就会保存在MySQL数据库中。

第二次编辑: 更多代码:

var sequentialCalls = [];

for ( var i = 0; i < tickers.length / chunkSize; i++ ) {
    sequentialCalls.push( persistYahooChunk );
}
sequentialCalls.push( function(callback) { 
    connection.end(); 
    callback();
});

async.series( sequentialCalls )



exports.persistYahooChunk = function(callback) {
console.log("Starting yahoo query");
var currentTickers = tickers.slice(currentTickerIndex,currentTickerIndex + chunkSize);


return yahooFinance.historical( {
    symbols: currentTickers,
    from: "2015-01-28",
    to: "2015-02-05"
}).then( function(result) {
    console.log("Query " + currentTickerIndex +  "/" + tickers.length + "completed");
    currentTickerIndex += chunkSize;
    //add valid data
    var toPersist = _.map(result, function(quotes, symbol) {
            return [symbol, quotes.length != 0 ];
    });


    var query = "INSERT INTO `ticker` (`symbol`, `valid`) VALUES ?";
    connection.query(query, [toPersist], function(err, result) {
        if (err) {
            console.log (err);
        }
        //console.log(result);

        callback();
    });
});

}

1 个答案:

答案 0 :(得分:1)

瓶颈是因为您每个股票代码都在进行一次查询。

根据您需要提取的数据,如果您可以执行包含所有代码的单个查询,则会更快。

以下是一个示例,如果您需要通过单个查询获取代码列表的所有当前价格:

http://finance.yahoo.com/webservice/v1/symbols/A,B,C,D,E/quote?format=json