qileilove

blog已经转移至github,大家请访问 http://qaseven.github.io/

浅析Java web程序之客户端和服务器端交互原理

1、协议

  a. TCP/IP整体构架概述

  TCP/IP协议并不完全符合 OSI的七层参考模型。传统的开放式系统互连参考模型,是一种通信协议的7层抽象的参考模型,其中每一层执行某一特定任务。该模型的目的是使各种硬件在相 同的层次上相互通信。这7层是:物理层、数据链路层、网路层、传输层、话路层、表示层和应用层。而TCP/IP通讯协议采用了4层的层级结构,每一层都呼 叫它的下一层所提供的网络来完成自己的需求。这4层分别为:

  i. 应用层:应用程序间沟通的层,如超文本传送协议(HTTP)、简单电子邮件传输(SMTP)、文件传输协议(FTP)、网络远程访问协议(Telnet)等。

  ii. 传输层:在此层中,它提供了节点间的数据传送服务,如传输控制协议(TCP)、用户数据报协议(UDP)等,TCP和UDP给数据包加入传输数据并把它传输到下一层中,这一层负责传送数据,并且确定数据已被送达并接收。

  iii. 互连网络层:负责提供基本的数据封包传送功能,让每一块数据包都能够到达目的主机(但不检查是否被正确接收),如网际协议(IP)。

  iv. 网络接口层:对实际的网络媒体的管理,定义如何使用实际网络(如Ethernet、Serial Line等)来传送数据。

  b. HTTP协议介绍:

  i. HTTP是一种超文本传送协议(HyperText Transfer Protocol),是一套计算机在网络中通信的一种规则。在TCP/IP体系结构中,HTTP属于应用层协议,位于TCP/IP协议的顶层

  ii. HTTP是一种无状态的的协议,意思是指 在Web 浏览器(客户端)和 Web 服务器之间不需要建立持久的连接。整个过程就是当一个客户端向服务器端发送一个请求(request),然后Web服务器返回一个响应 (response),之后连接就关闭了,在服务端此时是没有保留连接的信息。

  iii. HTTP 遵循 请求/响应(request/response) 模型的,所有的通信交互都被构造在一套请求和响应模型中。

  iv. 浏览WEB时,浏览器通过HTTP协议与WEB服务器交换信息,Web服务器向Web浏览器返回的文件都有与之相关的类型,这些信息类型的格式由MIME定义。

  c. 协议的java实现方式

  不论是TCP/IP协议也好,还是HTTP协议也好,java都是通过套接字(java.net.Socket)来实现的,可以参考我的另一篇技术博客:一个项目看java TCP/IP Socket编程(1.3版)

  2、HTTP报文接口及客户端和服务器端交互原理

  a. HTTP定义的事务处理由以下四步组成:

  i. 建立连接:

   例如我在浏览器里输入 http://cuishen.iteye.com,客户端请求这个地址时即打开了web服务器HTTP端口的一个套接字。因为在网络中间作为传递数据的 实体介质就是网线,数据实质上是通过IO流进行输出和输入,这就不难理解我们为什么在写一个Servlet的时候要引用 import java.io.*; 的原因 ,包括我们在向客户端回发结果的时候要用到PrintWriter对象的println()方法。其实请求的这个地址还要加上端口号80,80可以不写, 是因为浏览器默认的端口号是80。

  在Java底层代码中是这样实现的,只不过它们已经帮我们做了。

  1. Socket socket = new Socket("cuishen.iteye.com",80);    
  2. InputStream in = socket.getInputStream();    
  3. OutputStream out = socket.getOutputStream();

  ii. 客户端发送HTTP请求报文(request)

  一旦建立了TCP连接,Web浏览器就会向Web服务器发送请求命令,是一个ASCII文本请求行,后跟0个或多个HTTP头标,一个空行和实现请求的任意数据。

即报文分四个部分:请求行,请求头标,空行和请求数据

  1)请求行

  请求行由三个标记组成:请求方法、请求URL和HTTP版本,中间用空格分开

  例如: GET cuishen.iteye.com/blog/242842 HTTP/1.1

  HTTP规范定义了8种可能的请求方法:(最常见的就是 GET 和 POST 两种方法)

  ● GET -- 检索URI中标识资源的一个简单请求
  ● HEAD -- 与GET方法相同,服务器只返回状态行和头标,并不返回请求文档
  ● POST -- 服务器接受被写入客户端输出流中的数据的请求
  ● PUT -- 服务器保存请求数据作为指定URI新内容的请求
  ● DELETE -- 服务器删除URI中命名的资源的请求
  ● OPTIONS -- 关于服务器支持的请求方法信息的请求
  ● TRACE -- Web服务器反馈Http请求和其头标的请求
  ● CONNECT -- 已文档化但当前未实现的一个方法,预留做隧道处理

  2)请求头标

  请求头标:由key :value 健值组成,每行一对。请求头标用来通知服务器有关客户端的功能和标识。

  HOST -- 请求的哪一个服务器端地址,主地址,比如:我的技术blog:cuishen.iteye.com

  User-Agent -- 用户即客户端可以使用的浏览器 ,如: Mozilla/4.0

  Accept -- 即客户端可以接受的MIME 类型列表,如image/gif、text/html、application/msword

  Content-Length -- 只适用于POST请求,以字节给出POST数据的尺寸

  3)空行

  发送回车符和退行,通知服务器以下不再有头标。

  4)请求数据

  使用POST传送数据,最常使用的是Content-Type和Content-Length头标。

  请求报文总结:

  我们可以这样写出一个标准的 HTTP请求:

POST /blog/242842 HTTP1.1
HOST: cuishen.iteye.com/
User-Agent: Mozilla/4.0
Accpt: image/gif,text/html,application/pdf,image/png...
key=value&key=value&key=value...... (POST()请求的数据)

  这上面的一个例子意思是:

我要去访问的服务器端的地址是cuishen.iteye.com/ 它下面的资源 /blog/242842
连起来就是: cuishen.iteye.com/blog/242842
这个页面用的是 HTTP1.1 规范,我的浏览器版本是Mozilla/4.0
可以支持的MIME格式为 image/gif,text/html,application/pdf,image/png...等等

这个MIME格式我们在servlet中写法是:response.setContentType("text/html;charset=gb2312");
或者在jsp中写法是:<%@ page contentType="text/html;charset=gb2312"%>
或者在html中写法是:<meta http-equiv="content-Type" content="text/html; charset=gb2312">

  (c).空行:最后一个响应头标之后是一个空行,发送回车符和退行,表明服务器以下不再有头标。

  (d).响应数据:HTML文档和图像等,也就是HTML本身。out.println("<html>......");写到客户端。

  1. <html>    
  2. <head>    
  3. <title>Welcome to cuishen's IT blog</title>    
  4. </head>    
  5. <body>    
  6. <!-- 这里是具体的内容,看到了这里    
  7. 相信大家对 HTTP 工作原理及客户端与服务器交互过程已经很清楚了吧    
  8. -->     
  9. </body>    
  10. </html>

  iv. 服务器端关闭连接,客户端解析回发响应报文,恢复页面

  1)浏览器先解析状态行,查看请求是否成功的状态代码--HTTP响应码:404 400 200 ....

  2)解析每一个响应头标,如:

ContentType: text/html;charset=gb2312
Content-Length: 122 --- 响应中的字节数,只在浏览器使用永久(Keep-alive)HTTP连接时需要。

  3)读取响应数据HTML,根据标签<html></html>中的内容恢复标准的HTML格式页面或者其它。

  4)一个HTML 文档可能包含其它的需要被载入的资源,浏览器会识别,并对这些资源再进行额外的请求,这个过程可以是循环的方式一直到所有的数据都按照响应头标中规定的格式恢复到页面中。

  5)数据传送完毕,服务器端关闭连接,即无状态协议。

  3、总结

  不要被高深的名词和理论吓到,其实HTTP客户端和服务器端的交互原理很简单:即先是浏览器和服务器端建立Socket无状态连接,也就是短连 接,然后通过IO流进行报文信息(这个报文是严格遵循HTTP报文接口的)的交互,最后会话结束后就关闭连接。对于这些底层的协议和报文的打包解包交互的 实现,其实java和浏览器早都已经封装好了,程序员只要专注于业务逻辑的实现就行啦,这些都不必关心!!


posted on 2012-05-11 09:48 顺其自然EVO 阅读(428) 评论(0)  编辑  收藏


只有注册用户登录后才能发表评论。


网站导航:
 
<2012年5月>
293012345
6789101112
13141516171819
20212223242526
272829303112
3456789

导航

统计

常用链接

留言簿(55)

随笔分类

随笔档案

文章分类

文章档案

搜索

最新评论

阅读排行榜

评论排行榜