你如何解码节点中的gtfs protobufs

时间:2013-08-30 00:51:18

标签: javascript node.js gtfs protocol-buffers

我正在尝试使用https://github.com/dcodeIO/ProtoBuf.js来解析triments gtfs数据。

这是我到目前为止的代码,它正确解析.proto文件并创建构建器并具有所有预期的属性和方法,当我尝试使用它解码任何数据时会抛出错误。

Error: Data must be corrupt: Buffer overrun

原型文件来自https://developers.google.com/transit/gtfs-realtime/gtfs-realtime-proto

var ProtoBuf = require('protobufjs')
  , request = require('request')

var transit = ProtoBuf.protoFromFile('gtfs-realtime.proto').build('transit_realtime')

request('http://developer.trimet.org/ws/V1/FeedSpecAlerts/?appID=618F30BB3062F39AF24AED9EC', parse)

function parse(err, res, body) {
  try {
    console.log(transit.FeedMessage.decode(res.body))
  } catch(e) {
    console.log(e)
  }
}

感谢Brian Ferris,我能够解析标题gtfs_realtime_version: "1"的第一部分,但解析器在下一个组件上失败(时间戳uint64)

感谢

5 个答案:

答案 0 :(得分:3)

在搜索您遇到的同一问题时,我一直在寻找您的问题,希望我可以帮助其他人。在网上搜索的时间比我应该的时间长得多,我想出了一些有用的东西。在我解码了工作Feed之前,我对数据并不十分了解。

这在很大程度上似乎与数据的读取方式有关。我不是NodeJS的人,所以我不知道为什么,但它取决于如何用http而不是request来解码数据。我无法使用相同的方法来处理数据request

我从https://github.com/dcodeIO/ProtoBuf.js/wiki/How-to-read-binary-data-in-the-browser-or-under-node.js%3F找到了部分内容,但我还不太了解如何使用protobufjs,所以我在这里为其他人提供了一个有效的例子。希望它有所帮助。

var ProtoBuf = require('protobufjs');
var http = require("http");

// create a protobuf decoder
var transit = ProtoBuf.protoFromFile('gtfs-realtime.proto').build('transit_realtime');
// your protobuf binary feed URL
var feedUrl = "...";    

// HTTP GET the binary feed
http.get(feedUrl, parse);

// process the feed
function parse(res) {
    // gather the data chunks into a list
    var data = [];
    res.on("data", function(chunk) {
        data.push(chunk);
    });
    res.on("end", function() {
        // merge the data to one buffer, since it's in a list
        data = Buffer.concat(data);
        // create a FeedMessage object by decooding the data with the protobuf object
        var msg = transit.FeedMessage.decode(data);
        // do whatever with the object
        console.log(msg);
    }); 
});

答案 1 :(得分:1)

通过强制request模块具有空编码,我能够使其工作(无论如何使用纽约MTA提要),从而确保它返回缓冲区而不是字符串。像这样:

request({
    url: 'http://developer.trimet.org/ws/V1/FeedSpecAlerts/?appID=618F30BB3062F39AF24AED9EC'
    encoding: null
}, parse)

然后解析似乎工作正常。

答案 2 :(得分:1)

来自developers.google.com/transit/gtfs-realtime/code-samples的Google Developers页面。 谷歌现在已经制作了一个Node.js npm模块,可以让事情变得非常简单:

npm install gtfs-realtime-bindings

此处的Google代码段(Apache 2.0 License

var GtfsRealtimeBindings = require('gtfs-realtime-bindings');
var request = require('request');

var requestSettings = {
  method: 'GET',
  url: 'URL OF YOUR GTFS-REALTIME SOURCE GOES HERE',
  encoding: null
};
request(requestSettings, function (error, response, body) {
  if (!error && response.statusCode == 200) {
    var feed = GtfsRealtimeBindings.FeedMessage.decode(body);
    feed.entity.forEach(function(entity) {
      if (entity.trip_update) {
        console.log(entity.trip_update);
      }
    });
  }
});

答案 3 :(得分:0)

这不能解决您的问题,但您可以使用http://developer.trimet.org/ws/V1/FeedSpecAlerts/appid/618F30BB3062F39AF24AED9EC/text/true

等网址获取RT Feed文字

另请查看node-gtfs模块。

答案 4 :(得分:0)

我不是节点专家,但GTFS实时源的根消息类型是“FeedMessage”:

https://developers.google.com/transit/gtfs-realtime/reference

您似乎试图将Feed解析为“警报”消息:

console.log(transit.Alert.decode(res.body))

也许尝试将Alert更改为FeedMessage,看看会发生什么?