我正在尝试为以下问题陈述编写解析器逻辑。
我生成一个git日志文件,其格式如下:
--hash--date--author
num of lines added, num of lines deleted filepath1
num of lines added, num of lines deleted filepath2
num of lines added, num of lines deleted filepath3
样品:
--a14582d--2016-01-25--Phillip Verheyden
5 1 pom.xml
--4a90ef6--2016-01-19--Phillip Verheyden
1 5 pom.xml
--2a23e26--2015-09-25--jefffischer
--4cd0ae4--2015-09-25--Reginald C Cole
28 23 admin/broadleaf-admin-module/src/main/java/org/broadleafcommerce/admin/server/service/handler/SkuCustomPersistenceHandler.java
1 1 admin/broadleaf-open-admin-platform/src/main/java/org/broadleafcommerce/openadmin/server/service/persistence/datasource/SandBoxConnection.java
在解析之后,我们将在一段时间内总结每个文件的更改。
这种方法与代码MAAT中的Adam tornhill所做的相同。 https://github.com/adamtornhill/code-maat#churn-by-entity
他在Clojure做过一些出色的工作。
我想使用普通的旧java进行解析。
我应该采取什么方法?
对于文本解析而言,我是一个新手,超出了像CSV这样的东西。
注意:此练习适用于开源项目。
有人能指出我正确的方向吗?