我正在尝试在java中实现一个Web代理服务器,它将在我的浏览器和Web之间中继请求和响应。在当前设置中,我让我的浏览器将所有页面请求发送到指定端口上的localhost,我的代理正在该端口上侦听传入请求。
整个事情都是线程化的,因此可以同时处理多个请求,这就是我的代码的样子:
private void startProxy(int serverPort){
try {
// create a socket to listen on browser requests
ServerSocket servSocket = new ServerSocket(serverPort);
while(true) {
// create a thread for each connection
ProxyThread thread = new ProxyThread(servSocket.accept());
thread.start();
}
} catch (IOException e) {}
}
class ProxyThread extends Thread {
private Socket client;
private Socket server;
public ProxyThread(Socket client) {
this.client = client;
server = new Socket();
}
public void run() {
// passes on requests and responses here
}
我注意到当我尝试加载一个包含20个不同html / css / js请求的页面时,有时只创建了18-19个线程,在此过程中丢失了一些请求。大多数情况下,对js资源或图像的请求都会被丢弃,并且它们永远不会是浏览器发出的最后请求,因此不会出现资源耗尽的问题。
使用wireshark,我能够确定丢失的请求是否通过localhost,因此由于某种原因,ServerSocket.accept()实际上并不接受连接。是否有任何特殊原因可能发生这种情况?或许我的代码在某种程度上是错误的?
这是run()的主体
try {
BufferedReader clientOut = new BufferedReader(
new InputStreamReader(client.getInputStream()));
OutputStream clientIn = client.getOutputStream();
// assign default port to 80
int port = 80;
String request = "";
// read in the first line of a HTTP request containing the url
String subRequest = clientOut.readLine();
String host = getHost(subRequest);
// read in the rest of the request
while(!subRequest.equals("")) {
request += subRequest + "\r\n";
subRequest = clientOut.readLine();
}
request += "\r\n";
try {
server.connect(new InetSocketAddress(host, port));
} catch (IOException e) {
String errMsg = "HTTP/1.0 500\nContent Type: text/plain\n\n" +
"Error connecting to the server:\n" + e + "\n";
clientIn.write(errMsg.getBytes());
clientIn.flush();
}
PrintWriter serverOut = new PrintWriter(server.getOutputStream(), true);
serverOut.println(request);
serverOut.flush();
InputStream serverIn = server.getInputStream();
byte[] reply = new byte[4096];
int bytesRead;
while ((bytesRead = serverIn.read(reply)) != -1) {
clientIn.write(reply, 0, bytesRead);
clientIn.flush();
}
serverIn.close();
serverOut.close();
clientOut.close();
clientIn.close();
client.close();
server.close();
} catch(IOException e){
e.printStackTrace();
}
答案 0 :(得分:3)
对于有10个请求的网页,我得到10个HTTP GET,6个SYN和SYN,7个请求成功通过代理并且3个被卡住了。
因此,您有6个单独的连接,但有10个请求,并且您每个连接只处理一个请求。您忘记了实施HTTP keepalive。请参阅RFC 2616.每个连接可能会有多个请求到达。您需要读取内容长度标头定义的每个请求的完全字节数,或者块的总和,无论是什么,如果有的话,然后只需关闭套接字,您需要返回并尝试读另一个请求。如果这样可以让您结束流,请关闭套接字。
或者将您的响应作为HTTP 1.0或Connection: close
标头发送回客户端,因此它不会尝试将该连接重新用于其他请求。