如何使用Java在脚本中查找标记的特定属性?

时间:2013-04-29 12:49:09

标签: java regex string file

我在stackoverflow中一直在这里查看如何在大文本中搜索字符串部分。但我还没有设法找到如何使用Java在脚本中获取属性的特定值。目标是逐行读取文件(脚本),并提取属性" src"的值。

例如,该文件包含许多包含此结构的行:

<script src="js/vendor/modernizr-2.6.2.min.js"></script>
<script data-main="js/" src="js/require.min.js"></script>
<script data-main="js/" src="js/main.js"></script>
<script src="js/vendor/modernizr-2.6.2.min.js"></script>
<script data-main="js/" src="js/require.min.js"></script>

因此,使用Java我使用BufferedReader类以这种方式读取文件,我想为每一行获取&#34; src&#34;的值,例如,对于第一行,我想要得到:js/vendor/modernizr-2.6.2.min.js,对于第二行,我想获得js/require.min.js等等,我看到了一些像使用正则表达式的建议,但我不知道它是否是最有效的这种情况:

public Helper(String scriptPath) {
        File scriptFile = null;
        try {
            scriptFile = new File(scriptPath);
            String relativePath = scriptFile.getParent();
            System.out.println(relativePath);
            BufferedReader reader = new BufferedReader(new FileReader(scriptFile));
            String readLine;

            while ((readLine = reader.readLine()) != null) {
                // How to match the src?
            }

            reader.close();
        } catch (FileNotFoundException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

请,如果有人可以帮助我,我会真的很乐意,或者如果有人知道已经有了答案,请告诉我以便结束这个,但当时我是一直在寻找,我还没有发现这种问题。

非常感谢你。

1 个答案:

答案 0 :(得分:0)

您的文件看起来像html我会考虑使用Html Parser。 http://jsoup.org/非常容易使用css之类的选择器