如何使用Java直接从Internet读取文本文件?

时间:2011-06-06 23:55:13

标签: java file text-files java.util.scanner

我正在尝试从在线文本文件中读取一些单词。

我尝试过这样的事情

File file = new File("http://www.puzzlers.org/pub/wordlists/pocket.txt");
Scanner scan = new Scanner(file);

但它不起作用,我正在

http://www.puzzlers.org/pub/wordlists/pocket.txt 

作为输出,我只想得到所有的单词。

我知道他们在当天教我这个,但我现在不记得到底是怎么做的,非常感谢任何帮助。

8 个答案:

答案 0 :(得分:58)

使用URL代替File进行本地计算机上没有的访问。

URL url = new URL("http://www.puzzlers.org/pub/wordlists/pocket.txt");
Scanner s = new Scanner(url.openStream());

实际上,URL更为普遍有用,也适用于本地访问(使用file: URL),jar文件以及可以某种方式检索的所有内容。

上面的方法解释了您的平台默认编码中的文件。如果您想使用服务器指示的编码,则必须使用URLConnection并解析其内容类型,如this question的答案中所示。


关于您的错误,请确保您的文件编译没有任何错误 - 您需要处理异常。单击IDE提供的红色消息,它应该向您显示如何修复它的建议。不要启动无法编译的程序(即使IDE允许这样做)。

这里有一些示例异常处理:

try {
   URL url = new URL("http://www.puzzlers.org/pub/wordlists/pocket.txt");
   Scanner s = new Scanner(url.openStream());
   // read from your scanner
}
catch(IOException ex) {
   // there was some connection problem, or the file did not exist on the server,
   // or your URL was not in the right format.
   // think about what to do now, and put it here.
   ex.printStackTrace(); // for now, simply output it.
}

答案 1 :(得分:12)

尝试这样的事情

 URL u = new URL("http://www.puzzlers.org/pub/wordlists/pocket.txt");
 InputStream in = u.openStream();

然后将其用作任何普通的旧输入流

答案 2 :(得分:7)

对我来说真的有用:(来源:oracle文档"阅读网址")

 import java.net.*;
 import java.io.*;

 public class UrlTextfile {
public static void main(String[] args) throws Exception {

    URL oracle = new URL("http://yoursite.com/yourfile.txt");
    BufferedReader in = new BufferedReader(
    new InputStreamReader(oracle.openStream()));

    String inputLine;
    while ((inputLine = in.readLine()) != null)
        System.out.println(inputLine);
    in.close();
}
 }

答案 3 :(得分:4)

使用Apache Commons IO

import org.apache.commons.io.IOUtils;

import java.io.IOException;
import java.io.InputStream;
import java.net.URL;
import java.nio.charset.StandardCharsets;

public static String readURLToString(String url) throws IOException
{
    try (InputStream inputStream = new URL(url).openStream())
    {
        return IOUtils.toString(inputStream, StandardCharsets.UTF_8);
    }
}

答案 4 :(得分:2)

对于旧学校输入流,请使用以下代码:

  InputStream in = new URL("http://google.com/").openConnection().getInputStream();

答案 5 :(得分:2)

我通过以下方式为图像做到了这一点,你应该能够使用类似的步骤为文本做到这一点。

// folder & name of image on PC          
File fileObj = new File("C:\\Displayable\\imgcopy.jpg"); 

Boolean testB = fileObj.createNewFile();

System.out.println("Test this file eeeeeeeeeeeeeeeeeeee "+testB);

// image on server
URL url = new URL("http://localhost:8181/POPTEST2/imgone.jpg"); 
InputStream webIS = url.openStream();

FileOutputStream fo = new FileOutputStream(fileObj);
int c = 0;
do {
    c = webIS.read();
    System.out.println("==============> " + c);
    if (c !=-1) {
        fo.write((byte) c);
    }
} while(c != -1);

webIS.close();
fo.close();

答案 6 :(得分:1)

使用此代码将Internet资源读入String

public static String readToString(String targetURL) throws IOException
{
    URL url = new URL(targetURL);
    BufferedReader bufferedReader = new BufferedReader(
            new InputStreamReader(url.openStream()));

    StringBuilder stringBuilder = new StringBuilder();

    String inputLine;
    while ((inputLine = bufferedReader.readLine()) != null)
    {
        stringBuilder.append(inputLine);
        stringBuilder.append(System.lineSeparator());
    }

    bufferedReader.close();
    return stringBuilder.toString().trim();
}

这基于here

答案 7 :(得分:0)

或者,您可以使用Guava's Resources对象:

URL url = new URL("http://www.puzzlers.org/pub/wordlists/pocket.txt");
List<String> lines = Resources.readLines(url, Charsets.UTF_8);
lines.forEach(System.out::println);