有一家公交机构,它不提供GTFS格式的公交时刻表数据。我想制作一个可以在其中搜索的android应用程序,因此这种格式非常有用。 公交计划数据有一个网站,但似乎很难将有用的东西分开。
<td class="b stopPoint p0" background="nline.gif"><a href="line.cgi?id=1&dir=back&zero=15901&city=so&term=20141214"><img src="coming.gif" class="stopPoint" alt="A megállóhoz tartozó indulási időpontok megjelenítéséhez kérem, kattintson ide!" /></a></td>
<td class="b stopTime p0">2</td>
<td class="b stopPeakTime p0">2</td>
<td class="b stopName p0" colspan="1">Frankenburg úti aluljáró</td>
<td class="b stopTransfer p0"><img src="transfer.gif" class="iconTransfer" alt="Átszállási lehetőség a felsorolt autóbuszvonalakra" /> <a href="line.cgi?id=10&dir=to&zero=1590&city=so&term=20141214">10</a>, <a href="line.cgi?id=10Y&dir=to&zero=1590&city=so&term=20141214">10Y</a></td>
为此目的,现有的解析器可能会有所帮助。有工作吗?
答案 0 :(得分:1)
询问运输机构是否有任何方式可以以更有意义的格式提供计划数据。他们可能有一些比他们现有的更好的数据格式。
否则,您可能必须为此编写自定义刮刀/解析器。我喜欢使用python的beautifulsoup库解析html,但有很多方法可以做到这一点。