我从PDF中提取了一些样本数据,我需要编写一个解析器来提取数组中的文本和数字,以便进一步操作。我想我应该使用JFlex,但不知道如何开始
数据看起来像那样
Manager Salary 615/12/4129 2,200.00 2,300.00 100.00 4.35 2,200.00
2,300.00 100.00 4.35 27,600.00
Maintenance Payroll 615/12/4139 1,107.99 1,100.00 -7.99 -0.73 1,107.99 1,100.00 -7.99 -0.73 13,200.00
Payroll Taxes 615/12/4149 689.27 685.00 -4.27 -0.62 689.27 685.00 -4.27 -0.62 4,550.00
Workmen's Comp Insur 615/12/4159 360.49 905.00 544.51 60.17 360.49 905.00 544.51 60.17 4,590.00
Health Insur / Benefits 615/12/4169 485.70 845.00 359.30 42.52 485.70 845.00 359.30 42.52 10,140.00
有时,以615 /开头的令牌可以附加到描述中。这个想法就是说。如果一个标记是一个数字,那么数组[1],数组[2] ......取决于位置。其他任何东西都去了数组[0]
任何帮助表示赞赏。
开始使用JFlex语法并不容易提前致谢