所以我有一个全文的网页,它包含数千行信息,如姓名,办公室号码等。我试图找出最有效的方法来理解这些数据。我可以毫无问题地获得所有文本,但是最好的排序方法是什么,这样我就可以使用我的DAO将信息添加到适用的类中。
例如,我已经涉足使用正则表达式 - 但它变得凌乱。作为一个相对较新的Java,我想知道是否有更好的方法。
现在,我有类似的东西(这是非常宽松的,我只是尝试不同的东西,直到我让它工作,然后正确实施):
private void read()
{
BufferedReader reader = new BufferedReader(new InputSteamReader(urlOne.openStream()));
StringBuilder result = new StringBuilder();
while((result = reader.readLine()) != null)
{
//Regex here sorts things, once sorted it will add that to a List<foo>
}
}
对我而言,正则表达式似乎变得过于复杂,我只是觉得我为自己做的工作比我需要的更多。