在解析数据和存储时更有意义

时间:2012-03-13 15:51:49

标签: java php parsing

我有一个关于板球的网站,我需要在网站上显示Cricket记分卡。

我可以在以下csv逗号文件中获取记分卡的提要,该文件附在下面的链接中 http://collabedit.com/wav8v

在上面的文本填充数据是Raw格式,我想以这样的方式格式化数据我必须在网站上显示如下链接 你能建议怎么做吗? 一旦数据整齐保存,我可以将其显示给用户,如以下链接所示。 http://www.cricbuzz.com/cricket-scorecard-archives/scorecard/australia-v-india-26-feb-2012/10728

我的问题是我想解析这些数据并将其存储到数据库中,稍后我可以将其拾取并以任何格式显示。

我面临的挑战是如何识别文本文件中的块,如

第1座

#2031     Australia  v  India      4th Test      2011-12
at Adelaide  24/1/2012  to  28/1/2012    Australia won by 298 runs

第2座

Australia,1st Innings,Runs,Mins,BF,4s,6s,ScRt
EJM Cowan,c Laxman b Ashwin,30,110,63,3,,47.62
DA Warner,lbw b Zaheer,8,28,23,,,34.78
SE Marsh,b Ashwin,3,10,12,,,25.00
RT Ponting,c Tendulkar b Zaheer,221,516,404,21,,54.70
MJ Clarke*,b Yadav,210,380,275,26,1,76.36
MEK Hussey,run out,25,51,33,3,,75.76
BJ Haddin+,not out,42,92,66,1,2,63.64
PM Siddle,c Saha b Ashwin,2,12,15,,,13.33
RJ Harris,not out,35,64,51,2,1,68.63
BW Hilfenhaus,,,,,,,
NM Lyon,,,,,,,
,,,,,,,

第3区

 ,Extras [3b, 17lb, 8w, 0nb, 0p],28
636 min   157 ov,Total 7 (dec) for,604,189,275,17,,58.55

等。

要识别我认为可以使用行号的块,但Text文件的长度每次都在不断变化.. 现在任何人都可以告诉我任何解决这个问题的步骤

我正在考虑使用PHP或Java来实现此目的。

0 个答案:

没有答案