我的Java路上那些事儿

2015年7月19日

收录：一个性能较好的jvm参数配置以及jvm的简介

转自：http://blog.csdn.net/jeffreynicole/article/details/46953059

一个性能较好的web服务器jvm参数配置：

[plain] view plain copy

-server //服务器模式
-Xmx2g //JVM最大允许分配的堆内存，按需分配
-Xms2g //JVM初始分配的堆内存，一般和Xmx配置成一样以避免每次gc后JVM重新分配内存。
-Xmn256m //年轻代内存大小，整个JVM内存=年轻代 + 年老代 + 持久代
-XX:PermSize=128m //持久代内存大小
-Xss256k //设置每个线程的堆栈大小
-XX:+DisableExplicitGC //忽略手动调用GC, System.gc()的调用就会变成一个空调用，完全不触发GC
-XX:+UseConcMarkSweepGC //并发标记清除（CMS）收集器
-XX:+CMSParallelRemarkEnabled //降低标记停顿
-XX:+UseCMSCompactAtFullCollection //在FULL GC的时候对年老代的压缩
-XX:LargePageSizeInBytes=128m //内存页的大小
-XX:+UseFastAccessorMethods //原始类型的快速优化
-XX:+UseCMSInitiatingOccupancyOnly //使用手动定义初始化定义开始CMS收集
-XX:CMSInitiatingOccupancyFraction=70 //使用cms作为垃圾回收使用70％后开始CMS收集

说明：

-Xmn和-Xmx之比大概是1:9，如果把新生代内存设置得太大会导致young gc时间较长

一个好的Web系统应该是每次http请求申请内存都能在young gc回收掉，full gc永不发生，当然这是最理想的情况

xmn的值应该是保证够用（够http并发请求之用）的前提下设置得尽量小

web服务器和游戏服务器的配置思路不太一样，最重要的区别是对游戏服务器的xmn即年轻代设置比较大，和Xmx大概1:3的关系，因为游戏服务器一般是长连接，在保持一定的并发量后需要较大的年轻代堆内存，如果设置得大小了会经常引发young gc

对JVM的简介

由上图可以看出jvm堆内存的分类情况，JVM内存被分成多个独立的部分。
广泛地说，JVM堆内存被分为两部分——年轻代（Young Generation）和老年代（Old Generation）。

年轻代

年轻代是所有新对象产生的地方。当年轻代内存空间被用完时，就会触发垃圾回收。这个垃圾回收叫做Minor GC。年轻代被分为3个部分——Enden区和两个Survivor区。

年轻代空间的要点：
大多数新建的对象都位于Eden区。
当Eden区被对象填满时，就会执行Minor GC。并把所有存活下来的对象转移到其中一个survivor区。
Minor GC同样会检查存活下来的对象，并把它们转移到另一个survivor区。这样在一段时间内，总会有一个空的survivor区。
经过多次GC周期后，仍然存活下来的对象会被转移到年老代内存空间。通常这是在年轻代有资格提升到年老代前通过设定年龄阈值来完成的。

年老代

年老代内存里包含了长期存活的对象和经过多次Minor GC后依然存活下来的对象。通常会在老年代内存被占满时进行垃圾回收。老年代的垃圾收集叫做Major GC。Major GC会花费更多的时间。

Stop the World事件
所有的垃圾收集都是“Stop the World”事件，因为所有的应用线程都会停下来直到操作完成（所以叫“Stop the World”）。

因为年轻代里的对象都是一些临时（short-lived ）对象，执行Minor GC非常快，所以应用不会受到（“Stop the World”）影响。

由于Major GC会检查所有存活的对象，因此会花费更长的时间。应该尽量减少Major GC。因为Major GC会在垃圾回收期间让你的应用反应迟钝，所以如果你有一个需要快速响应的应用发生多次Major GC，你会看到超时错误。

垃圾回收时间取决于垃圾回收策略。这就是为什么有必要去监控垃圾收集和对垃圾收集进行调优。从而避免要求快速响应的应用出现超时错误。

永久代

永久代或者“Perm Gen”包含了JVM需要的应用元数据，这些元数据描述了在应用里使用的类和方法。注意，永久代不是Java堆内存的一部分。
永久代存放JVM运行时使用的类。永久代同样包含了Java SE库的类和方法。永久代的对象在full GC时进行垃圾收集。

方法区
方法区是永久代空间的一部分，并用来存储类型信息（运行时常量和静态变量）和方法代码和构造函数代码。

内存池
如果JVM实现支持，JVM内存管理会为创建内存池，用来为不变对象创建对象池。字符串池就是内存池类型的一个很好的例子。内存池可以属于堆或者永久代，这取决于JVM内存管理的实现。

运行时常量池
运行时常量池是每个类常量池的运行时代表。它包含了类的运行时常量和静态方法。运行时常量池是方法区的一部分。

Java栈内存
Java栈内存用于运行线程。它们包含了方法里的临时数据、堆里其它对象引用的特定数据。

Java垃圾回收
Java垃圾回收会找出没用的对象，把它从内存中移除并释放出内存给以后创建的对象使用。Java程序语言中的一个最大优点是自动垃圾回收，不像其他的程序语言那样需要手动分配和释放内存，比如C语言。

垃圾收集器是一个后台运行程序。它管理着内存中的所有对象并找出没被引用的对象。所有的这些未引用的对象都会被删除，回收它们的空间并分配给其他对象。

一个基本的垃圾回收过程涉及三个步骤：
标记：这是第一步。在这一步，垃圾收集器会找出哪些对象正在使用和哪些对象不在使用。
正常清除：垃圾收集器清会除不在使用的对象，回收它们的空间分配给其他对象。
压缩清除：为了提升性能，压缩清除会在删除没用的对象后，把所有存活的对象移到一起。这样可以提高分配新对象的效率。

简单标记和清除方法存在两个问题：
效率很低。因为大多数新建对象都会成为“没用对象”。
经过多次垃圾回收周期的对象很有可能在以后的周期也会存活下来。
上面简单清除方法的问题在于Java垃圾收集的分代回收的，而且在堆内存里有年轻代和年老代两个区域。

Java垃圾回收类型

这里有五种可以在应用里使用的垃圾回收类型。

仅需要使用JVM开关就可以在我们的应用里启用垃圾回收策略。

Serial GC（-XX:+UseSerialGC）：Serial GC使用简单的标记、清除、压缩方法对年轻代和年老代进行垃圾回收，即Minor GC和Major GC。Serial GC在client模式（客户端模式）很有用，比如在简单的独立应用和CPU配置较低的机器。这个模式对占有内存较少的应用很管用。
Parallel GC（-XX:+UseParallelGC）：除了会产生N个线程来进行年轻代的垃圾收集外，Parallel GC和Serial GC几乎一样。这里的N是系统CPU的核数。我们可以使用 -XX:ParallelGCThreads=n 这个JVM选项来控制线程数量。并行垃圾收集器也叫throughput收集器。因为它使用了多CPU加快垃圾回收性能。Parallel GC在进行年老代垃圾收集时使用单线程。
Parallel Old GC（-XX:+UseParallelOldGC）：和Parallel GC一样。不同之处，Parallel Old GC在年轻代垃圾收集和年老代垃圾回收时都使用多线程收集。
并发标记清除（CMS）收集器（-XX:+UseConcMarkSweepGC)：CMS收集器也被称为短暂停顿并发收集器。它是对年老代进行垃圾收集的。CMS收集器通过多线程并发进行垃圾回收，尽量减少垃圾收集造成的停顿。CMS收集器对年轻代进行垃圾回收使用的算法和Parallel收集器一样。这个垃圾收集器适用于不能忍受长时间停顿要求快速响应的应用。可使用 -XX:ParallelCMSThreads=n JVM选项来限制CMS收集器的线程数量。
G1垃圾收集器（-XX:+UseG1GC) G1（Garbage First）：垃圾收集器是在Java 7后才可以使用的特性，它的长远目标时代替CMS收集器。G1收集器是一个并行的、并发的和增量式压缩短暂停顿的垃圾收集器。G1收集器和其他的收集器运行方式不一样，不区分年轻代和年老代空间。它把堆空间划分为多个大小相等的区域。当进行垃圾收集时，它会优先收集存活对象较少的区域，因此叫“Garbage First”。

posted @ 2015-07-19 22:57 云云阅读(1207) | 评论 (0) | 编辑收藏

2014年9月28日

linux 系列

http://www.blogjava.net/fancydeepin/archive/2014/09/28/linux.html

17．ubuntu 防火墙
16．ubuntu 开启 ssh 服务
15．ubuntu jdk 安装与配置
14．ubuntu tomcat 安装与配置
13．ubuntu mysql 安装
12．ubuntu root 和 user 用户切换
11．linux more 命令
10．linux tar 命令
09．linux chmod 命令
08．linux touch 命令
07．linux cat 命令
06．linux mv 命令
05．linux rm 命令
04．linux cp 命令
03．linux mkdir 命令
02．linux cd 命令
01．linux ls 命令

posted @ 2014-09-28 23:45 云云| 编辑收藏

Java动态代理机制详解（JDK 和CGLIB，Javassist，ASM）[转]

摘要: class文件简介及加载 Java编译器编译好Java文件之后，产生.class 文件在磁盘中。这种class文件是二进制文件，内容是只有JVM虚拟机能够识别的机器码。JVM虚拟机读取字节码文件，取出二进制数据，加载到内存中，解析.class 文件内的信息，生成对应的 Class对象: &nb... 阅读全文

posted @ 2014-09-28 23:44 云云| 编辑收藏

后台 xss 控制

package com.qiyi.appstore.util;

import java.lang.reflect.Field;

import java.lang.reflect.InvocationTargetException;

import org.apache.commons.beanutils.BeanUtils;

import org.apache.commons.lang.StringUtils;

import org.slf4j.Logger;

import org.slf4j.LoggerFactory;

import com.qiyi.appstore.exception.AppStoreException;

import com.qiyi.cloud.user.ApiCode;

public class XssUtils {

private static final Logger logger=LoggerFactory.getLogger(XssUtils.class);

public static String getSafeStringXSS(String s){

if (StringUtils.isBlank(s)) {

return s;

}

StringBuilder sb = new StringBuilder(s.length() + 16);

for (int i = 0; i < s.length(); i++) {

char c = s.charAt(i);

switch (c) {

case '<':

sb.append("<");

break;

case '>':

sb.append(">");

break;

case '\'':

sb.append("′");// ´");

break;

case '′':

sb.append("′");// ´");

break;

case '\"':

sb.append(""");

break;

case '＂':

sb.append(""");

break;

case '&':

sb.append("＆");

break;

case '#':

sb.append("＃");

break;

case '\\':

sb.append('￥');

break;

case '=':

sb.append("=");

break;

default:

sb.append(c);

break;

}

return sb.toString();

}

public static <T> void getXssSaftBean(Class<?> clz,T bean) throws IllegalAccessException, InvocationTargetException, NoSuchMethodException{

String classname = clz.getSimpleName();

logger.info("map target class name is {} .",classname);

Field[] fields = clz.getDeclaredFields();

for(Field field : fields){

Class<?> type = field.getType();

if(type.equals(String.class)){

String fieldname = field.getName();

String value = BeanUtils.getProperty(bean, fieldname);

if(StringUtils.isNotBlank(value)){

BeanUtils.setProperty(bean, fieldname, getSafeStringXSS(value));

}

posted @ 2014-09-28 13:49 云云阅读(727) | 评论 (0) | 编辑收藏

2014年1月16日

提升tomcat 性能 apr扩展lib

提升tomcat 性能 apr扩展lib
使用apr类库可以让tomcat的性能提升到3到4倍
目前项目中都使用这样的配置

<Connector port="8080" protocol="org.apache.coyote.http11.Http11AprProtocol" URIEncoding="UTF-8"

enableLookups="false"

acceptCount="300"

connectionTimeout="20000"

disableUploadTimeout="true" maxThreads="1000" maxSpareThreads="50" minSpareThreads="25"

redirectPort="8443" />

catalia.sh

CATALINA_OPTS="$CATALINA_OPTS -Djava.library.path=/usr/local/apr/lib"

posted @ 2014-01-16 14:50 云云阅读(912) | 评论 (0) | 编辑收藏

2014年1月15日

redis 设置分布式锁

摘要: public static boolean acquireLock(String lock) { // 1. 通过SETNX试图获取一个lock boolean success = false; Jedis jedis = pool.getResource();... 阅读全文

posted @ 2014-01-15 19:00 云云阅读(13405) | 评论 (1) | 编辑收藏

2014年1月9日

Eclipse背景颜色和字体配置

对eclipse的默认配置很不爽，黑色字体白色底好刺眼，而且字体习惯用Courier New

改变背景颜色：

windows->Preferences->General->Editor->Text Editors

右边选择Appearance color options

选Background color 选择背景颜色

个人比较舒服的豆沙绿色和黑色背景，但黑色背景还要把其他的字体颜色也改了才好看，而且豆沙绿色跟默认的字体颜色搭配的很好。

豆沙绿色（色调：85 饱和度：123 亮度：205 ）

据说这个色调是眼科专家配的，因其颜色比较柔和，据说阅读的时候用这种颜色做背景有利于保护眼睛， word底色就许多人设置成豆沙绿色。

xml的字体调整：

window--preferences--General--appearance--colors and fonts--Basic-- "Text font "

然后点change,可以设置字体，我喜欢Courier New

Java的字体调整：

window--preferences--General--appearance--colors and fonts--java

posted @ 2014-01-09 16:41 云云阅读(1812) | 评论 (0) | 编辑收藏

2013年12月5日

删除文件的svn信息解决从其它路径拷过来的文件带有路径信息无法提交的问题

有时候在项目中会变化路径把原有路径的文件拷到新的路径下面
再删除原来不想的路径再提交一次这样以来原来的路径确实不存在了
但是拷过来的文件带有原来路径的svn信息这样以来在提交的时候就无法提交
想要文件按照的路径提交但始终svn还是再往以前的路径提交并提示你路径不存在
在网上搜了下如何删除文件自带的svn路径信息
按照下面的方式来操作即可

Windows Registry Editor Version 5.00
[HKEY_LOCAL_MACHINE\SOFTWARE\Classes\Folder\shell\DeleteSVN]
@="删除该目录下面.svn文件"
[HKEY_LOCAL_MACHINE\SOFTWARE\Classes\Folder\shell\DeleteSVN\command]
@="cmd.exe /c \"TITLE Removing SVN Folders in %1 && COLOR 9A && FOR /r \"%1\" %%f IN (.svn) DO RD /s /q \"%%f\" \""

把上面这段文字保存问一个Done.reg文件
然后执行,导入到注册表
就会在你右键一个文件夹的时候多出来一个菜单"删除该目录下面.svn文件"
执行该命令即可

posted @ 2013-12-05 17:17 云云阅读(720) | 评论 (0) | 编辑收藏

2013年11月26日

mybatis No enum const class org.apache.ibatis.type.JdbcType.Date 坑爹的配置

在ibatis中不需要关注这些参数而转到mybatis后如果字段值为空必须设置jdbcType
如
insert into testTable
   (ID,
   NAME,
   DESCRIPTION,
   IMAGEURL,
   LINKURL,
   ISALWAYS,
   ISDISPLAYINDEX,
   DISPLAYWEIGHT,
   STARTTIME,
   ENDTIME,
   CREATOR,
   CREATTIME,
   MODIFYTIME)
  values
   (SEQ_ACTIVITY_TABLE.NEXTVAL,
   #{name},
   #{desc,jdbcType=VARCHAR},
   #{imageUrl,jdbcType=VARCHAR},
   #{linkUrl,jdbcType=VARCHAR},
   #{isAlways,jdbcType=CHAR},
   #{isDisplayIndex,jdbcType=CHAR},
   #{displayWeight,jdbcType=VARCHAR},
   #{startTime,jdbcType=DATE},
   #{endTime,jdbcType=DATE},
   #{creator,jdbcType=VARCHAR},
   sysdate,
   sysdate
   )
</insert>

这些设置之多，太烦了，最让人烦的是 jdbcType = DATE，类型还必须大写，不能小写。
如下面的例子，将DATE 改成 Date 。结果让人很抓狂啊！！！
insert into testTable
   (ID,
   NAME,
   DESCRIPTION,
   IMAGEURL,
   LINKURL,
   ISALWAYS,
   ISDISPLAYINDEX,
   DISPLAYWEIGHT,
   STARTTIME,
   ENDTIME,
   CREATOR,
   CREATTIME,
   MODIFYTIME)
  values
   (SEQ_ACTIVITY_TABLE.NEXTVAL,
   #{name},
   #{desc,jdbcType=VARCHAR},
   #{imageUrl,jdbcType=VARCHAR},
   #{linkUrl,jdbcType=VARCHAR},
   #{isAlways,jdbcType=CHAR},
   #{isDisplayIndex,jdbcType=CHAR},
   #{displayWeight,jdbcType=VARCHAR},
   #{startTime,jdbcType=Date},
   #{endTime,jdbcType=DATE},
   #{creator,jdbcType=VARCHAR},
   sysdate,
   sysdate
   )
</insert>

org.mybatis.spring.MyBatisSystemException: nested exception is org.apache.ibatis.builder.BuilderException: Error resolving JdbcType. Cause: java.lang.IllegalArgumentException: No enum const class org.apache.ibatis.type.JdbcType.Date
	org.mybatis.spring.MyBatisExceptionTranslator.translateExceptionIfPossible(MyBatisExceptionTranslator.java:75)
	org.mybatis.spring.SqlSessionTemplate$SqlSessionInterceptor.invoke(SqlSessionTemplate.java:368)

更坑爹的在后面，上面insert时的时候用#{endTime,jdbcType=DATE},可以将时间插入成功，且可以精确到时分秒
但如果在update语句中也这样使用，那你得到的只会有日期，这够坑爹的了吧，尼玛比起ibatis方便之处差远了
要想在update语句中将时间格式化成时分秒不得不再加一个类型如下面：
startTime = #{startTime,javaType=DATE, jdbcType=VARCHAR}

posted @ 2013-11-26 21:02 云云阅读(21431) | 评论 (1) | 编辑收藏

2013年11月5日

走过路过不要错过的好文章 CSRF 防御方法选择之道

CSRF 背景与介绍

CSRF（Cross Site Request Forgery, 跨站域请求伪造）是一种网络的攻击方式，它在 2007 年曾被列为互联网 20 大安全隐患之一。其他安全隐患，比如 SQL 脚本注入，跨站域脚本攻击等在近年来已经逐渐为众人熟知，很多网站也都针对他们进行了防御。然而，对于大多数人来说，CSRF 却依然是一个陌生的概念。即便是大名鼎鼎的 Gmail, 在 2007 年底也存在着 CSRF 漏洞，从而被黑客攻击而使 Gmail 的用户造成巨大的损失。

CSRF 攻击实例

CSRF 攻击可以在受害者毫不知情的情况下以受害者名义伪造请求发送给受攻击站点，从而在并未授权的情况下执行在权限保护之下的操作。比如说，受害者 Bob 在银行有一笔存款，通过对银行的网站发送请求 http://bank.example/withdraw?account=bob&amount=1000000&for=bob2 可以使 Bob 把 1000000 的存款转到 bob2 的账号下。通常情况下，该请求发送到网站后，服务器会先验证该请求是否来自一个合法的 session，并且该 session 的用户 Bob 已经成功登陆。黑客 Mallory 自己在该银行也有账户，他知道上文中的 URL 可以把钱进行转帐操作。Mallory 可以自己发送一个请求给银行：http://bank.example/withdraw?account=bob&amount=1000000&for=Mallory。但是这个请求来自 Mallory 而非 Bob，他不能通过安全认证，因此该请求不会起作用。这时，Mallory 想到使用 CSRF 的攻击方式，他先自己做一个网站，在网站中放入如下代码： src=”http://bank.example/withdraw?account=bob&amount=1000000&for=Mallory ”，并且通过广告等诱使 Bob 来访问他的网站。当 Bob 访问该网站时，上述 url 就会从 Bob 的浏览器发向银行，而这个请求会附带 Bob 浏览器中的 cookie 一起发向银行服务器。大多数情况下，该请求会失败，因为他要求 Bob 的认证信息。但是，如果 Bob 当时恰巧刚访问他的银行后不久，他的浏览器与银行网站之间的 session 尚未过期，浏览器的 cookie 之中含有 Bob 的认证信息。这时，悲剧发生了，这个 url 请求就会得到响应，钱将从 Bob 的账号转移到 Mallory 的账号，而 Bob 当时毫不知情。等以后 Bob 发现账户钱少了，即使他去银行查询日志，他也只能发现确实有一个来自于他本人的合法请求转移了资金，没有任何被攻击的痕迹。而 Mallory 则可以拿到钱后逍遥法外。

CSRF 攻击的对象

在讨论如何抵御 CSRF 之前，先要明确 CSRF 攻击的对象，也就是要保护的对象。从以上的例子可知，CSRF 攻击是黑客借助受害者的 cookie 骗取服务器的信任，但是黑客并不能拿到 cookie，也看不到 cookie 的内容。另外，对于服务器返回的结果，由于浏览器同源策略的限制，黑客也无法进行解析。因此，黑客无法从返回的结果中得到任何东西，他所能做的就是给服务器发送请求，以执行请求中所描述的命令，在服务器端直接改变数据的值，而非窃取服务器中的数据。所以，我们要保护的对象是那些可以直接产生数据改变的服务，而对于读取数据的服务，则不需要进行 CSRF 的保护。比如银行系统中转账的请求会直接改变账户的金额，会遭到 CSRF 攻击，需要保护。而查询余额是对金额的读取操作，不会改变数据，CSRF 攻击无法解析服务器返回的结果，无需保护。

当前防御 CSRF 的几种策略

在业界目前防御 CSRF 攻击主要有三种策略：验证 HTTP Referer 字段；在请求地址中添加 token 并验证；在 HTTP 头中自定义属性并验证。下面就分别对这三种策略进行详细介绍。

验证 HTTP Referer 字段

根据 HTTP 协议，在 HTTP 头中有一个字段叫 Referer，它记录了该 HTTP 请求的来源地址。在通常情况下，访问一个安全受限页面的请求来自于同一个网站，比如需要访问 http://bank.example/withdraw?account=bob&amount=1000000&for=Mallory，用户必须先登陆 bank.example，然后通过点击页面上的按钮来触发转账事件。这时，该转帐请求的 Referer 值就会是转账按钮所在的页面的 URL，通常是以 bank.example 域名开头的地址。而如果黑客要对银行网站实施 CSRF 攻击，他只能在他自己的网站构造请求，当用户通过黑客的网站发送请求到银行时，该请求的 Referer 是指向黑客自己的网站。因此，要防御 CSRF 攻击，银行网站只需要对于每一个转账请求验证其 Referer 值，如果是以 bank.example 开头的域名，则说明该请求是来自银行网站自己的请求，是合法的。如果 Referer 是其他网站的话，则有可能是黑客的 CSRF 攻击，拒绝该请求。

这种方法的显而易见的好处就是简单易行，网站的普通开发人员不需要操心 CSRF 的漏洞，只需要在最后给所有安全敏感的请求统一增加一个拦截器来检查 Referer 的值就可以。特别是对于当前现有的系统，不需要改变当前系统的任何已有代码和逻辑，没有风险，非常便捷。

然而，这种方法并非万无一失。Referer 的值是由浏览器提供的，虽然 HTTP 协议上有明确的要求，但是每个浏览器对于 Referer 的具体实现可能有差别，并不能保证浏览器自身没有安全漏洞。使用验证 Referer 值的方法，就是把安全性都依赖于第三方（即浏览器）来保障，从理论上来讲，这样并不安全。事实上，对于某些浏览器，比如 IE6 或 FF2，目前已经有一些方法可以篡改 Referer 值。如果 bank.example 网站支持 IE6 浏览器，黑客完全可以把用户浏览器的 Referer 值设为以 bank.example 域名开头的地址，这样就可以通过验证，从而进行 CSRF 攻击。

即便是使用最新的浏览器，黑客无法篡改 Referer 值，这种方法仍然有问题。因为 Referer 值会记录下用户的访问来源，有些用户认为这样会侵犯到他们自己的隐私权，特别是有些组织担心 Referer 值会把组织内网中的某些信息泄露到外网中。因此，用户自己可以设置浏览器使其在发送请求时不再提供 Referer。当他们正常访问银行网站时，网站会因为请求没有 Referer 值而认为是 CSRF 攻击，拒绝合法用户的访问。

在请求地址中添加 token 并验证

CSRF 攻击之所以能够成功，是因为黑客可以完全伪造用户的请求，该请求中所有的用户验证信息都是存在于 cookie 中，因此黑客可以在不知道这些验证信息的情况下直接利用用户自己的 cookie 来通过安全验证。要抵御 CSRF，关键在于在请求中放入黑客所不能伪造的信息，并且该信息不存在于 cookie 之中。可以在 HTTP 请求中以参数的形式加入一个随机产生的 token，并在服务器端建立一个拦截器来验证这个 token，如果请求中没有 token 或者 token 内容不正确，则认为可能是 CSRF 攻击而拒绝该请求。

这种方法要比检查 Referer 要安全一些，token 可以在用户登陆后产生并放于 session 之中，然后在每次请求时把 token 从 session 中拿出，与请求中的 token 进行比对，但这种方法的难点在于如何把 token 以参数的形式加入请求。对于 GET 请求，token 将附在请求地址之后，这样 URL 就变成 http://url?csrftoken=tokenvalue。而对于 POST 请求来说，要在 form 的最后加上 <input type=”hidden” name=”csrftoken” value=”tokenvalue”/>，这样就把 token 以参数的形式加入请求了。但是，在一个网站中，可以接受请求的地方非常多，要对于每一个请求都加上 token 是很麻烦的，并且很容易漏掉，通常使用的方法就是在每次页面加载时，使用 javascript 遍历整个 dom 树，对于 dom 中所有的 a 和 form 标签后加入 token。这样可以解决大部分的请求，但是对于在页面加载之后动态生成的 html 代码，这种方法就没有作用，还需要程序员在编码时手动添加 token。

该方法还有一个缺点是难以保证 token 本身的安全。特别是在一些论坛之类支持用户自己发表内容的网站，黑客可以在上面发布自己个人网站的地址。由于系统也会在这个地址后面加上 token，黑客可以在自己的网站上得到这个 token，并马上就可以发动 CSRF 攻击。为了避免这一点，系统可以在添加 token 的时候增加一个判断，如果这个链接是链到自己本站的，就在后面添加 token，如果是通向外网则不加。不过，即使这个 csrftoken 不以参数的形式附加在请求之中，黑客的网站也同样可以通过 Referer 来得到这个 token 值以发动 CSRF 攻击。这也是一些用户喜欢手动关闭浏览器 Referer 功能的原因。

在 HTTP 头中自定义属性并验证

这种方法也是使用 token 并进行验证，和上一种方法不同的是，这里并不是把 token 以参数的形式置于 HTTP 请求之中，而是把它放到 HTTP 头中自定义的属性里。通过 XMLHttpRequest 这个类，可以一次性给所有该类请求加上 csrftoken 这个 HTTP 头属性，并把 token 值放入其中。这样解决了上种方法在请求中加入 token 的不便，同时，通过 XMLHttpRequest 请求的地址不会被记录到浏览器的地址栏，也不用担心 token 会透过 Referer 泄露到其他网站中去。

然而这种方法的局限性非常大。XMLHttpRequest 请求通常用于 Ajax 方法中对于页面局部的异步刷新，并非所有的请求都适合用这个类来发起，而且通过该类请求得到的页面不能被浏览器所记录下，从而进行前进，后退，刷新，收藏等操作，给用户带来不便。另外，对于没有进行 CSRF 防护的遗留系统来说，要采用这种方法来进行防护，要把所有请求都改为 XMLHttpRequest 请求，这样几乎是要重写整个网站，这代价无疑是不能接受的。

Java 代码示例

下文将以 Java 为例，对上述三种方法分别用代码进行示例。无论使用何种方法，在服务器端的拦截器必不可少，它将负责检查到来的请求是否符合要求，然后视结果而决定是否继续请求或者丢弃。在 Java 中，拦截器是由 Filter 来实现的。我们可以编写一个 Filter，并在 web.xml 中对其进行配置，使其对于访问所有需要 CSRF 保护的资源的请求进行拦截。

在 filter 中对请求的 Referer 验证代码如下
清单 1. 在 Filter 中验证 Referer

// 从 HTTP 头中取得 Referer 值 
 String referer=request.getHeader("Referer");  
 // 判断 Referer 是否以 bank.example 开头 
 if((referer!=null) &&(referer.trim().startsWith(“bank.example”))){  
    chain.doFilter(request, response);  
 }else{  
    request.getRequestDispatcher(“error.jsp”).forward(request,response);  
 }

以上代码先取得 Referer 值，然后进行判断，当其非空并以 bank.example 开头时，则继续请求，否则的话可能是 CSRF 攻击，转到 error.jsp 页面。

如果要进一步验证请求中的 token 值，代码如下

<em><strong>清单 2. 在 filter 中验证请求中的</strong></em> token

HttpServletRequest req = (HttpServletRequest)request;  
 HttpSession s = req.getSession();  
  
 // 从 session 中得到 csrftoken 属性 
 String sToken = (String)s.getAttribute(“csrftoken”);  
 if(sToken == null){  
  
    // 产生新的 token 放入 session 中 
    sToken = generateToken();  
    s.setAttribute(“csrftoken”,sToken);  
    chain.doFilter(request, response);  
 } else{  
  
    // 从 HTTP 头中取得 csrftoken  
    String xhrToken = req.getHeader(“csrftoken”);  
  
    // 从请求参数中取得 csrftoken  
    String pToken = req.getParameter(“csrftoken”);  
    if(sToken != null && xhrToken != null && sToken.equals(xhrToken)){  
        chain.doFilter(request, response);  
    }else if(sToken != null && pToken != null && sToken.equals(pToken)){  
        chain.doFilter(request, response);  
    }else{  
        request.getRequestDispatcher(“error.jsp”).forward(request,response);  
    }  
 }

首先判断 session 中有没有 csrftoken，如果没有，则认为是第一次访问，session 是新建立的，这时生成一个新的 token，放于 session 之中，并继续执行请求。如果 session 中已经有 csrftoken，则说明用户已经与服务器之间建立了一个活跃的 session，这时要看这个请求中有没有同时附带这个 token，由于请求可能来自于常规的访问或是 XMLHttpRequest 异步访问，我们分别尝试从请求中获取 csrftoken 参数以及从 HTTP 头中获取 csrftoken 自定义属性并与 session 中的值进行比较，只要有一个地方带有有效 token，就判定请求合法，可以继续执行，否则就转到错误页面。生成 token 有很多种方法，任何的随机算法都可以使用，Java 的 UUID 类也是一个不错的选择。

除了在服务器端利用 filter 来验证 token 的值以外，我们还需要在客户端给每个请求附加上这个 token，这是利用 js 来给 html 中的链接和表单请求地址附加 csrftoken 代码，其中已定义 token 为全局变量，其值可以从 session 中得到。

<em><strong>清单 3. 在客户端对于请求附加</strong> </em>token

function appendToken(){  
    updateForms();  
    updateTags();  
 }  
  
 function updateForms() {  
    // 得到页面中所有的 form 元素 
    var forms = document.getElementsByTagName('form');  
    for(i=0; i<forms.length; i++) {  
        var url = forms[i].action;  
  
        // 如果这个 form 的 action 值为空，则不附加 csrftoken  
        if(url == null || url == "" ) continue;  
  
        // 动态生成 input 元素，加入到 form 之后 
        var e = document.createElement("input");  
        e.name = "csrftoken";  
        e.value = token;  
        e.type="hidden";  
        forms[i].appendChild(e);  
    }  
 }  
  
 function updateTags() {  
    var all = document.getElementsByTagName('a');  
    var len = all.length;  
  
    // 遍历所有 a 元素 
    for(var i=0; i<len; i++) {  
        var e = all[i];  
        updateTag(e, 'href', token);  
    }  
 }  
  
 function updateTag(element, attr, token) {  
    var location = element.getAttribute(attr);  
    if(location != null && location != '' '' ) {  
        var fragmentIndex = location.indexOf('#');  
        var fragment = null;  
        if(fragmentIndex != -1){  
  
            //url 中含有只相当页的锚标记 
            fragment = location.substring(fragmentIndex);  
            location = location.substring(0,fragmentIndex);  
        }  
  
        var index = location.indexOf('?');  
  
        if(index != -1) {  
            //url 中已含有其他参数 
            location = location + '&csrftoken=' + token;  
        } else {  
            //url 中没有其他参数 
            location = location + '?csrftoken=' + token;  
        }  
        if(fragment != null){  
            location += fragment;  
        }  
  
        element.setAttribute(attr, location);  
    }  
 }

在客户端 html 中，主要是有两个地方需要加上 token，一个是表单 form，另一个就是链接 a。这段代码首先遍历所有的 form，在 form 最后添加一隐藏字段，把 csrftoken 放入其中。然后，代码遍历所有的链接标记 a，在其 href 属性中加入 csrftoken 参数。注意对于 a.href 来说，可能该属性已经有参数，或者有锚标记。因此需要分情况讨论，以不同的格式把 csrftoken 加入其中。

如果你的网站使用 XMLHttpRequest，那么还需要在 HTTP 头中自定义 csrftoken 属性，利用 dojo.xhr 给 XMLHttpRequest 加上自定义属性代码如下：

<strong><em>清单 4. 在 HTTP 头中自定义属性</em></strong>

                 
var plainXhr = dojo.xhr;  
 
// 重写 dojo.xhr 方法 
dojo.xhr = function(method,args,hasBody) {  
   // 确保 header 对象存在 
   args.headers = args.header || {};  
 
   tokenValue = '<%=request.getSession(false).getAttribute("csrftoken")%>';  
   var token = dojo.getObject("tokenValue");  
 
   // 把 csrftoken 属性放到头中 
   args.headers["csrftoken"] = (token) ? token : "  ";  
   return plainXhr(method,args,hasBody);  
};

这里改写了 dojo.xhr 的方法，首先确保 dojo.xhr 中存在 HTTP 头，然后在 args.headers 中添加 csrftoken 字段，并把 token 值从 session 里拿出放入字段中。

CSRF 防御方法选择之道

通过上文讨论可知，目前业界应对 CSRF 攻击有一些克制方法，但是每种方法都有利弊，没有一种方法是完美的。如何选择合适的方法非常重要。如果网站是一个现有系统，想要在最短时间内获得一定程度的 CSRF 的保护，那么验证 Referer 的方法是最方便的，要想增加安全性的话，可以选择不支持低版本浏览器，毕竟就目前来说，IE7+, FF3+ 这类高版本浏览器的 Referer 值还无法被篡改。

如果系统必须支持 IE6，并且仍然需要高安全性。那么就要使用 token 来进行验证，在大部分情况下，使用 XmlHttpRequest 并不合适，token 只能以参数的形式放于请求之中，若你的系统不支持用户自己发布信息，那这种程度的防护已经足够，否则的话，你仍然难以防范 token 被黑客窃取并发动攻击。在这种情况下，你需要小心规划你网站提供的各种服务，从中间找出那些允许用户自己发布信息的部分，把它们与其他服务分开，使用不同的 token 进行保护，这样可以有效抵御黑客对于你关键服务的攻击，把危害降到最低。毕竟，删除别人一个帖子比直接从别人账号中转走大笔存款严重程度要轻的多。

如果是开发一个全新的系统，则抵御 CSRF 的选择要大得多。笔者建议对于重要的服务，可以尽量使用 XMLHttpRequest 来访问，这样增加 token 要容易很多。另外尽量避免在 js 代码中使用复杂逻辑来构造常规的同步请求来访问需要 CSRF 保护的资源，比如 window.location 和 document.createElement(“a”) 之类，这样也可以减少在附加 token 时产生的不必要的麻烦。

最后，要记住 CSRF 不是黑客唯一的攻击手段，无论你 CSRF 防范有多么严密，如果你系统有其他安全漏洞，比如跨站域脚本攻击 XSS，那么黑客就可以绕过你的安全防护，展开包括 CSRF 在内的各种攻击，你的防线将如同虚设。

总结与展望

可见，CSRF 是一种危害非常大的攻击，又很难以防范。目前几种防御策略虽然可以很大程度上抵御 CSRF 的攻击，但并没有一种完美的解决方案。一些新的方案正在研究之中，比如对于每次请求都使用不同的动态口令，把 Referer 和 token 方案结合起来，甚至尝试修改 HTTP 规范，但是这些新的方案尚不成熟，要正式投入使用并被业界广为接受还需时日。在这之前，我们只有充分重视 CSRF，根据系统的实际情况选择最合适的策略，这样才能把 CSRF 的危害降到最低。

posted @ 2013-11-05 20:53 云云阅读(748) | 评论 (0) | 编辑收藏

仅列出标题下一页

我的Java路上那些事儿

收录：一个性能较好的jvm参数配置以及jvm的简介

linux 系列

Java动态代理机制详解（JDK 和CGLIB，Javassist，ASM）[转]

后台 xss 控制

提升tomcat 性能 apr扩展lib

redis 设置分布式锁

Eclipse背景颜色和字体配置

删除文件的svn信息解决从其它路径拷过来的文件带有路径信息无法提交的问题

mybatis No enum const class org.apache.ibatis.type.JdbcType.Date 坑爹的配置

走过路过不要错过的好文章 CSRF 防御方法选择之道

日历

常用链接

留言簿(9)

随笔档案

搜索

最新评论

阅读排行榜

评论排行榜