从网站

时间:2015-05-06 15:58:10

标签: java

我在Java方面不是很先进,所以我根本不知道如何去做这件事。我很感激一些指针或指南,所以我可以学习。提前致谢。这是我的问题:

public static void main (String [] args ){

    ArrayList Heaven = new ArrayList(); 
    Heaven.add("heaven"); 
    Heaven.add("seven"); 
    Heaven.add("eleven"); 
    Heaven.add("7-11");
}

我不想花时间输入特定单词的所有押韵。有更快的方法吗?

最好是从此页面获取信息的方式:http://www.rhymezone.com/r/rhyme.cgi?Word=heaven&typeofrhyme=perfect&org1=syl&org2=l&org3=y

2 个答案:

答案 0 :(得分:0)

如果你还没有一个押韵词的列表,你只需要输入所有这些(或者将它们全部放在某种配置文件中并阅读),但无论如何你都是只需输入它们。

你从rhymezone那里打电话收获被称为抓取。您可以在此处查看:Web scraping with Java,了解使用Java抓取页面的最佳方法。我还会查看rhymezone关于他们的抓取政策,或者他们是否提供了一个API(官方方式来获取他们的数据)。

此外,如果你正在为他们的网站搜索这类信息,你可能会想要搜索一个单词的数据,并将其存储在某个地方,这样你每次想要查找时都不会刮到他们的页面。字。

答案 1 :(得分:0)

您需要使用JSOUP API,将其与htmlcleaner API混合使用,这将为您提供通过JSOUP选择器遍历DOM树并获取所需信息的好方法。