首先声明,这个可能已经算是老掉牙的东西了~~~Long Long ago
断断续续两周时间来看了看tomcat4的源码。虽然有点古旧,但是配合着《How tomcat works》一书看看源码,还是很惬意的事情。中途数次想拿起纸笔抑或打开word书写下笔记,但是书中简洁的文风让我觉得没有什么可以记下的。直到最后读完这书,过完源码。才觉得应该记下一些要点来。简单称之为总结吧。
其实搞懂tomcat或者是类似的servlet的工作原理,只要配合理解这张图就可以了。这就是tomcat的整个工作流程。
一个HTTP请求到来,其实本质上只是一个输入流,在这个流中蕴含了那些字节代表了这个请求的语义。而图中的1.message就抽象了这个流,把它表示为一条信息。在到达容器的第一时刻,容器是交给connector来处理的。首先这里得考虑一个容器的启动过程,启动时做的一个重要事情就是初始化connector,而connector初始化时干什么呢?显然,创建socket。一切初始化好了,才有第一步消息到来这件事情咯。
信息到了,connector干的事情就是如图中的2和3步——创建http请求对象和响应对象。当然这个行为也不是connector自己干的,它只是雇佣了一个叫做HttpProcessor的兄弟来干活。真正的creation都是这个兄弟干的。HttpProcessor里面设计了一些简单的并发多线程trick,基本上就是让socket等待着请求信息的到来,来一个,就处理一个。HttpProcessor的一句话总结就是利用多线程技术parse整个请求的stream。几个parse步骤分别是:解析connection;解析request;解析headers。补充一句,request和response对象都是在HttpProcessor初始化的时候初始化的,但是它们内容的填充是在parse的时候完成的。
接着,connector的任务就结束了。然后一个invoke其实就是工作的交接,该context重磅登场了。Context以其名字就决定了其霸气的侧漏无疑,基本上所有的东西都包含在内。我们把3的invoke当做一些context的自我设置(初始化),那么4的invoke就是context的表演开始了。首先在图里没有给出的是loader和logger的处理,context会在这两个依赖对象不为空的情况下运行它们。Loader是设置java class loader的,tomcat自己定义了一个classloader来加载特定的类。而logger无非就是把日志给启动起来。当然在启动pipeline之前做了启动subcontainer的操作。这是可以理解的,用计算机本质的递归来理解,有点像是先序遍历树的感觉。而pipeline被启动后,后续还有一个manager的启动,这个manager是主要用来管理session的。而所有这些都是可以配置的。
照着上图主要说说pipeline,pipeline就是流水线了,上面有很多的阀门valve,阀门可以自己加,pipeline的的工作就是步骤5,顺序invoke每个阀门。其实也不是pipeline启动,pipeline其实只是启动了内置的pipelineContext对象,而这个对象会不断的调用invokenext()方法来实现流水线的执行。而这些个valve会调用wrapper,他们的invoke方法会启动wrapper,在检测完mapping后,wrapper会allocate一个servlet实例,接着servlet启动、干活、开始自己的生命周期……这个世界就开始活跃了。
That is it
最后奉上一张稍微详细点的图帮助理解。
当然,美妙的设计这里没有讲,不是因为时间不够或者是空间不足,而是我自己还没有完全的消化,tomcat我认为从设计上讲,结构是beautiful的。光是lifecycle的设计以及各个类模块区分(connector,loader,context,wrapper以及manager等等)之间的初始化调用等细节每个拿出来都够写本书了。So~~~read the fucking source code by yourself。
参考资料:
《How tomcat works》
Tomcat 系统架构与设计模式,第 1 部分: 工作原理http://www.ibm.com/developerworks/cn/java/j-lo-tomcat1/