随笔-62  评论-29  文章-0  trackbacks-0
一、超文本传输协议及HTTP包
    HTTP协议用于在Internet上发送和接收消息。HTTP协议是一种请求-应答式的协议——客户端发送一个请求,服务器返回该请求的应答,所有的请求与应答都是HTTP包。HTTP协议使用可靠的TCP连接,默认端口是80。HTTP的第一个版本是HTTP/0.9,后来发展到了HTTP/1.0,现在最新的版本是HTTP/1.1。HTTP/1.1由RFC 2616 定义。
    在HTTP中,Client/Server之间的会话总是由客户端通过建立连接和发送HTTP请求包初始化,服务器不会主动联系客户端或要求与客户端建立连接。浏览器和服务器都可以随时中断连接,例如,在浏览网页时你可以随时点击“停止”按钮中断当前的文件下载过程,关闭与Web服务器的HTTP连接。
  1 HTTP请求包
  HTTP请求包(GET、POST等请求方法)由三个部分构成,分别是:方法-URI-协议/版本,请求头,请求正文。下面是一个HTTP请求包(GET)的例子:

    Socket socket    = new Socket("127.0.0.1", 8080);
   
    OutputStream os  = socket.getOutputStream();
    InputStream  ins = socket.getInputStream();
    StringBuffer sb=new StringBuffer();
    sb.append("POST /index.jsp HTTP/1.1\r\n");//注意\r\n为回车换行
    sb.append("Accept-Language: zh-cn\r\n");
    sb.append("Connection: Keep-Alive\r\n");
    sb.append("Host: 192.168.0.106\r\n");
    sb.append("Content-Length: 37\r\n");
    sb.append("\r\n");
    sb.append("userName=new_andy&password=new_andy\r\n");
    sb.append("\r\n");
   
    //向Web服务器发送一个HTTP请求包
    os.write(sb.toString().getBytes()); 
    os.close();
请求包的第一行是方法-URI-协议/版本:
    GET就是请求方法,根据HTTP标准,HTTP请求可以使用多种请求方法。HTTP 1.1支持七种请求方法:GET、POST、HEAD、OPTIONS、PUT、DELETE和TRACE等,常用的为请求方法是GET和POST。
    /index.jsp表示URI。URI指定了要访问的网络资源。
    HTTP/1.1是协议和协议的版本。
    最后一行userName=new_andy&password=new_andy为正文,正文与HTTP头部有一个空行(\r\n)分隔。这里需要说明的一点,其中Content-Length说明正文的长度,有的正文长度没有在头部说明,只是标明Transfer-Encoding: chunked。关于chunked类型的长度计算方法,见RFC 1626。
    请求包的头部还会包含许多有关客户端环境和请求正文的有用信息,这里不再描述。
  2 HTTP应答包

  和HTTP请求包相似,由三个部分构成,分别是:协议-状态代码-描述,应答头,应答正文。下面是一个HTTP应答的例子:

StringBuffer buffer = new StringBuffer();
   buffer.append("HTTP/1.1 200 OK\r\n");
   buffer.append("Date: Tue, 14 Sep 1999 02:19:57 GMT\r\n");
   buffer.append("Server: Apache/1.2.6\r\n");
   buffer.append("Connection: close\r\n");
   buffer.append("Content-Type: text/html\r\n");
   buffer.append("\r\n");
   buffer.append("<html><head><title>解读HTTP包示例</title></head><body>test</body></html>\r\n");
   //bout.write(buffer.toString().getBytes());
   
   
    //向Web服务器发送一个HTTP请求包
    try {
   this.output.write(buffer.toString().getBytes());
   this.output.flush();
  } catch (IOException e) {
   // TODO Auto-generated catch block
   e.printStackTrace();
  } 

HTTP应答包的第一行类似于HTTP请求的第一行,表示所用的协议是HTTP 1.1,服务器处理请求的状态码200。
  应答头也和请求头一样包含许多有用的信息,例如服务器类型、日期时间、内容类型和长度等。应答的正文就是服务器返回的HTML页面。应答头和正文之间也用CRLF分隔。
二、Socket类与ServerSocket类
  在Java中,通信端点由java.net.Socket类(客户端)或java.net.ServerSocket类(服务器端)表示。应用程序通过端点向网络发送或从网络读取数据。位于两台不同机器上的应用软件通过网络连接发送和接收字节流,从而实现通信。要把HTTP包发送给另一个应用,首先要知道对方的IP地址以及其通信端点的端口号。
   Socket类代表的是客户端,它是一个连接远程服务器应用时临时创建的端点。
   ServerSocker类代表的是服务器端,它启动后等待来自客户端的连接请求;一旦接收到请求,ServerSocket创建一个Socket实例来处理与该客户端的通信。对于服务器应用,我们不知道客户端应用什么时候会试图连接服务器,服务器必须一直处于等待连接的状态。

  下面是ServerSocket提供了四个构造函数,常用的构造函数的的一种形式为:
  public ServerSocket(int port, int backLog, InetAddress bindingAddress);
  参数:port指定服务器端监听客户端的端口;
  backlog为连接请求的最大队列长度,一旦超越这个长度,服务器端点开始拒绝客户端的连接请求。
  bindingAddress是一个java.net.InetAddress的实例,指定绑定IP地址。
   创建好ServerSocket实例之后,调用它的accept方法,要求它等待传入的连接请求。只有出现了连接请求时,accept方法才会返回,它的返回值是一个Socket类的实例。随后,这个Socket对象就可以用来与客户端应用通信。
 
  Socket类有许多构造函数,常用的为:
  public Socket(String host, int port)。参数是主机名称(IP地址或域名)和端口号。
   参数host是远程机器的名字或IP地址,port是远程应用的端口号。
   成功创建了Socket类的实例之后,我们就可以用它来发送和接收字节流形式的数据,数据一般为HTTP包。
  
   要发送字节流,首先要调用Socket类的getOutputStream方法获得一个java.io.OutputStream对象;要从连接的另一端接收字节流,首先要调用Socket类的getInputStream方法获得一个java.io.InputStream对象。
   下面的代码片断创建一个与本地HTTP服务器(127.0.0.1代表本地主机的IP地址)通信的Socket,发送一个HTTP请求包,准备接收服务器的应答。

三、读取HTTP包
  以下我自己设计的一个读取HTTP包的类SocketRequest。

package com.eri.sas.sms;

import java.io.IOException;
import java.io.InputStream;
import java.io.OutputStream;
import java.net.Socket;

public class SocketRequest extends Thread
{ // 从指定的Socket的InputStream中读取数据

 private InputStream input;
 
 private OutputStream output;
 
 private Socket msocket =null;

 private String uri;

 private StringBuffer request = new StringBuffer(); // 用于保存所有内容

 private int CONTENT_LENGTH = 0; // 实际包内容数据长

 private boolean bePost = false;

 private boolean beHttpResponse = false;

 private boolean beChucked = false;

 private boolean beGet = false;

 private byte crlf13 = (byte) 13; // '\r'

 private byte crlf10 = (byte) 10; // '\n'

 public SocketRequest(InputStream input) {
  this.input = input;
 }

 public SocketRequest(Socket socket) throws IOException {
  this.input = socket.getInputStream();
  this.output = socket.getOutputStream();
  msocket =socket;
 }

 public void run()
 {
  ReadData();
  //
  System.out.println("all content \r\n" + getData());
  
  //
  WirteDate();
  //
  close();
 }
 
 public void WirteDate() {
  /**
   *  HTTP/1.1 200 OK
   Server: Microsoft-IIS/4.0
   Date: Mon, 3 Jan 2005 13:13:33 GMT
   Content-Type: text/html
   Last-Modified: Mon, 11 Jan 2004 13:23:42 GMT
   Content-Length: 90
   
   <html>
   <head>
   <title>解读HTTP包示例</title></head><body>
   Hello WORLD!
   </body>
   </html>
   */
    StringBuffer sb=new StringBuffer();
    sb.append("HTTP/1.1 200 OK\r\n");//注意\r\n为回车换行
    sb.append("Server: Microsoft-IIS/4.0\r\n");
    sb.append("Date: Mon, 3 Jan 2005 13:13:33 GMT\r\n");
    sb.append("Content-Type: text/html\r\n");
    sb.append("Last-Modified: Mon, 11 Jan 2004 13:23:42 GMT\r\n");
   // sb.append("Content-Length: 90\r\n");
    sb.append("\r\n");
    sb.append("<html>\r\n");
    sb.append("<head>\r\n");
    sb.append("<title>解读HTTP包示例ss</title></head><body>\r\n");
    sb.append("ssssssssssss</body>\r\n");
   
    sb.append("</html>\r\n");
   
   
     StringBuffer buffer = new StringBuffer();
   buffer.append("HTTP/1.1 200 OK\r\n");
   buffer.append("Date: Tue, 14 Sep 1999 02:19:57 GMT\r\n");
   buffer.append("Server: Apache/1.2.6\r\n");
   buffer.append("Connection: close\r\n");
   buffer.append("Content-Type: text/html\r\n");
   buffer.append("\r\n");
   buffer.append("<html><head><title>解读HTTP包示例</title></head><body>test</body></html>\r\n");
   //bout.write(buffer.toString().getBytes());
   
   
    //向Web服务器发送一个HTTP请求包
    try {
   this.output.write(buffer.toString().getBytes());
   this.output.flush();
  } catch (IOException e) {
   // TODO Auto-generated catch block
   e.printStackTrace();
  } 
 }

 public void ReadData()
 { // 解析 获得InputStream的数据

  ReadHeader(); // 头部

  if (beChucked) // 为Chucked
  {
   int ChuckSize = 0;
   while ((ChuckSize = getChuckSize()) > 0) // 多个Chucked
   {
    readLenData(ChuckSize + 2);// 读取定长数据
   }
   readLenData(2); // 最后的2位
  }

  if (CONTENT_LENGTH > 0) {
   readLenData(CONTENT_LENGTH);// 读取定长数据
  }

  uri = "";
  
  parseUri(new String(request));
 }

 private void readLenData(int size) // 读取定长数据
 {
  int readed = 0; // 已经读取数
  try {
   int available = 0;// input.available(); //可读数
   if (available > (size - readed))
    available = size - readed;
   while (readed < size) {
    while (available == 0) { // 等到有数据可读
     available = input.available(); // 可读数
    }
    if (available > (size - readed))
     available = size - readed; // size-readed--剩余数
    if (available > 2048)
     available = 2048; // size-readed--剩余数
    byte[] buffer = new byte[available];
    int reading = input.read(buffer);
    request = request.append(new String(buffer, 0, reading)); // byte数组相加
    readed += reading; // 已读字符
   }
  } catch (IOException e) {
   System.out.println("Read readLenData Error!");
  }
 }

 private void ReadHeader() // 读取头部 并获得大小
 {
  byte[] crlf = new byte[1];
  int crlfNum = 0; // 已经连接的回车换行数 crlfNum=4为头部结束
  try {
   while (input.read(crlf) != -1) // 读取头部
   {
    if (crlf[0] == crlf13 || crlf[0] == crlf10) {
     crlfNum++;
    } else {
     crlfNum = 0;
    } // 不是则清
    request = request.append(new String(crlf, 0, 1)); // byte数组相加
    if (crlfNum == 4)
     break;
   }
  } catch (IOException e) {
   System.out.println("Read Http Header Error!");
   return;
  }

  String tempStr = (new String(request)).toUpperCase();

  // 这里我只处理了GET与POST方法
  String strMethod = tempStr.substring(0, 4);
  if (strMethod.equals("GET ")) // 前
  {
   beGet = true;
  } else if (strMethod.equals("POST")) {
   bePost = true;
   getContentlen_Chucked(tempStr);
  } else {
   System.out.println("不支持的HTTP包类型");

  } // 其它的其它类型 暂不支持
 }

 private void getContentlen_Chucked(String tempStr) // 获得长度 CONTENT-LENGTH 或
              // 是否为CHUNKED型
 {
  String ss1 = "CONTENT-LENGTH:";
  String ss2 = new String("TRANSFER-ENCODING: CHUNKED");

  int clIndex = tempStr.indexOf(ss1);
  int chuckIndex = tempStr.indexOf(ss2); // 为CHUNKED型
  byte requst[] = tempStr.getBytes();
  if (clIndex != -1) { // 从clIndex+1起至\r\n
   StringBuffer sb = new StringBuffer();

   for (int i = (clIndex + 16);; i++) {
    if (requst[i] != (byte) 13 && requst[i] != (byte) 10) {
     sb.append((char) requst[i]);
    } else
     break;
   }

   CONTENT_LENGTH = Integer.parseInt(sb.toString()); // 正式的HTML文件的大小
   // System.out.println("CONTENT_LENGTH== "+CONTENT_LENGTH);
  }
  if (chuckIndex != -1)
   beChucked = true;
 }

 private int getChuckSize() // Chuck大小
 {
  byte[] crlf = new byte[1];
  StringBuffer sb1 = new StringBuffer();

  int crlfNum = 0; // 已经连接的回车换行数 crlfNum=4为头部结束

  try {
   while (input.read(crlf) != -1) // 读取头部
   {
    if (crlf[0] == crlf13 || crlf[0] == crlf10) {
     crlfNum++;
    } else {
     crlfNum = 0;
    } // 不是则清
    sb1.append((char) crlf[0]);
    request = request.append(new String(crlf, 0, 1)); // byte数组相加
    if (crlfNum == 2)
     break;
   }
  } catch (IOException e) {
   System.out.println("Read Http Package Error!");
   return 0;
  }

  return Integer.parseInt((sb1.toString()).trim(), 16); // 16进控制
 }

 // 通过此来进行过滤,是否为发至目标服务器的HTTP包
 private String parseUri(String requestString)
 {
  int index1, index2;
  index1 = requestString.indexOf(' ');
  if (index1 != -1) {
   index2 = requestString.indexOf(' ', index1 + 1);
   if (index2 > index1)
    return requestString.substring(index1 + 1, index2);
  }
  return null;
 }

 public String getData()
 {
  return request.toString();
 }
 

 /**
  * close
  */
 public void close() {
  try {
   if (input != null)
    input.close();
   if (msocket != null)
    msocket.close();
  } catch (Exception e) {
   e.printStackTrace();
  }
 }
}



posted on 2008-10-22 15:44 阅读(9002) 评论(1)  编辑  收藏

评论:
# re: HTTP 协议实现 2008-10-22 15:53 |
in.read()==-1 时候,应该是对方out流close()的时候.所以我们一般不用in.read方式, 而用read length的方式来对取对应长度的数据.  回复  更多评论
  

只有注册用户登录后才能发表评论。


网站导航: