Java从css文件中获取所有类和id名称

时间:2017-02-28 15:06:08

标签: java css scrape

我试图从数组中的css文件中获取所有类和ID。数组应如下所示:

UsedIds: {"#id1, "#id2" etc.etc.etc.}
UsedClasses: {".class1", ".class2" etc.etc.etc.}

如何在不获取“。”的情况下获得这些结果。在花括号内?我试图删除每个“{code inside}”段,但是有媒体查询和与之冲突的东西。我的第一次尝试是在这里,但我并不为此感到骄傲...它只删除了卷曲代码,但我现在仍然坚持这一点。你们知道一个更简单的解决方案吗?

private void getCssClasses(String fileName) {
    File cssFile = new File(fileName);
    Scanner sc;
    try {
        sc = new Scanner(cssFile);
        while (sc.hasNextLine()) {
            String cssLine = sc.nextLine();
            int firstCurly = 0;
            int lastCurly = 0;
            while (cssLine.contains("{")) {
                for (int i = 0; i < cssLine.length(); i++) {
                    String character = "" + cssLine.charAt(i);
                    //System.out.println(character);
                    if (character.contains("{")) {
                        //System.out.println("IN");
                        firstCurly = i;
                    }
                    if (character.contains("}")) {
                        if(firstCurly != 0){
                        System.out.println("OUT");
                        lastCurly = i;
                        }
                    }
                    if (firstCurly != 0 && lastCurly != 0) {
                        StringBuilder sb = new StringBuilder(cssLine);
                        sb.delete(firstCurly, lastCurly);
                        cssLine = sb.toString();
                        System.out.println("YES");
                        break;
                    }
                }
            }
        }
    } catch (FileNotFoundException e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
    }

}

0 个答案:

没有答案