对.txt文件进行XML解析,在控制台上不打印任何内容

时间:2016-02-29 14:51:45

标签: java xml dom xml-parsing text-files

这是我第一次尝试解析XML,所以要温柔地对待我:)。

所以我下载了一个网页的源代码,我想从http://www.songlyrics.com/eminem/my-name-is-lyrics/解析某些信息。

现在我将XML文件复制粘贴到记事本中。 我将文件保存为XML - 1

我的代码如下所示:

public class Program 
{
    public static void main(String[] args)
    {
        System.out.println("Program starts:");

        DocumentBuilderFactory documentBuilderFactory = DocumentBuilderFactory.newInstance();
        try
        {
            DocumentBuilder documentBuilder = documentBuilderFactory.newDocumentBuilder();
            Document document = documentBuilder.parse(new File("C:/Users/volca_000/Desktop/XML - 1.txt"));
            NodeList paragraphsNodeList =  document.getElementsByTagName("p");

            for (int i = 0;i < paragraphsNodeList.getLength();i++)
            {
                Node paragraphNode = paragraphsNodeList.item(i);
                if (paragraphNode.getNodeType() == Node.TEXT_NODE)
                {
                    Element element = (Element)paragraphNode;
                    String node = element.getTextContent();
                    System.out.println(node);
                }
            }
        } 
        catch (ParserConfigurationException e)
        {
            e.printStackTrace();
        }
        catch (SAXException e)
        {
            e.printStackTrace();
        }
        catch (IOException e)
        {
            e.printStackTrace();
        }
        catch (Exception e)
        {
            e.printStackTrace();
        }
    } // End of main
} // End of Program class

即使我放弃了if语句,也无法在控制台上获取任何内容。

if (paragraphNode.getNodeType() == Node.TEXT_NODE)

我做错了什么?任何建议都将非常感激。

0 个答案:

没有答案