为什么批量请求要尽可能的合并操作

前言

线上情况：

线上Redis集群，多个Twemproxy代理（nutcracker），LVS DR路由均衡调度
客户端使用Jedis操作Redis集群，一个程序进程实例使用原先1024个工作线程处理请求，若干个进程实例
一天超过22亿次请求，网络一般情况下，一天超过上万个连接失败异常
运维同学告知，LVS压力较大

改进工作：

工作线程由原先1024改用16个
每个线程每次最多操作1000个Redis命令批量提交

实际效果：

一天不到一亿次的请求量
LVS压力大减
CPU压力降低到原先1/3以下
单个请求抽样调研平均减少1-90毫秒时间（尤其是跨机房处理）

Redis支持批量提交

原生支持批量操作方式

一般命令前缀若添加上m字符串，表示支持多个、批量命令提交了。

显式的...

MSET key value [key value ...]
MSETNX key value [key value ...]

HMGET key field [field ...]
HMSET key field value [field value ...]

一般方式的...

HDEL key field [field ...]
SREM key member [member ...]
RPUSH key value [value ...]
......

更多，请参考：http://redis.cn/commands.html

pipeline管道方式

官方文档：http://redis.io/topics/pipelining

Redis Client把所有命令一起打包发送到Redis Server，然后阻塞等待处理结果
Redis Server必须在处理完所有命令前先缓存起所有命令的处理结果
打包的命令越多，缓存消耗内存也越多
不是打包的命令越多越好
实际环境需要根据命令执行时间等各种因素选择合并命令的个数，以及测试效果等

Java队列支持

一般业务、接入前端请求量过大，生产者速度过快，这时候使用队列暂时缓存会比较好一些，消费者直接直接从队列获取任务，通过队列让生产者和消费者进行分离这也是业界普通采用的方式。

监控队列

有的时候，若可以监控一下队列消费情况，可以监控一下，就很直观。同事为队列添加了一个监控线程，清晰明了了解队列消费情况。

示范

示范使用了Redis Pipeline，线程池，准备数据，生产者-消费者队列，队列监控等，消费完毕，程序关闭。

/**
 * 以下测试在Jedis 2.6下测试通过
 * 
 * @author nieyong
 * 
 */
public class TestJedisPipeline {
    private static final int NUM = 512;
    private static final int MAX = 1000000; // 100W

    private static JedisPool redisPool;
    private static final ExecutorService pool = Executors.newCachedThreadPool();
    protected static final BlockingQueue<String> queue = new ArrayBlockingQueue<String>(
            MAX); // 100W
    private static boolean finished = false;

    static {
        JedisPoolConfig config = new JedisPoolConfig();
        config.setMaxActive(64);
        config.setMaxIdle(64);

        try {
            redisPool = new JedisPool(config, "192.168.192.8", 6379, 10000,
                    null, 0);
        } catch (Exception e) {
            System.err.println("Init msg redis factory error! " + e.toString());
        }
    }

    public static void main(String[] args) throws InterruptedException {
        System.out.println("prepare test data 100W");
        prepareTestData();
        System.out.println("prepare test data done!");

        // 生产者，模拟请求100W次
        pool.execute(new Runnable() {
            @Override
            public void run() {
                for (int i = 0; i < MAX; i++) {
                    if (i % 3 == 0) {
                        queue.offer("del_key key_" + i);
                    } else {
                        queue.offer("get_key key_" + i);
                    }
                }
            }
        });

        // CPU核数*2 个工作者线程
        int threadNum = 2 * Runtime.getRuntime().availableProcessors();

        for (int i = 0; i < threadNum; i++)
            pool.execute(new ConsumerTask());

        pool.execute(new MonitorTask());

        Thread.sleep(10 * 1000);// 10sec
        System.out.println("going to shutdown server ...");
        setFinished(true);
        pool.shutdown();

        pool.awaitTermination(1, TimeUnit.MILLISECONDS);

        System.out.println("colse!");
    }

    private static void prepareTestData() {
        Jedis redis = redisPool.getResource();
        Pipeline pipeline = redis.pipelined();

        for (int i = 0; i < MAX; i++) {
            pipeline.set("key_" + i, (i * 2 + 1) + "");

            if (i % (NUM * 2) == 0) {
                pipeline.sync();
            }
        }
        pipeline.sync();
        redisPool.returnResource(redis);
    }

    // queue monitor，生产者-消费队列监控
    private static class MonitorTask implements Runnable {

        @Override
        public void run() {
            while (!Thread.interrupted() && !isFinished()) {
                System.out.println("queue.size = " + queue.size());
                try {
                    Thread.sleep(500); // 0.5 second
                } catch (InterruptedException e) {
                    break;
                }
            }
        }
    }

    // consumer，消费者
    private static class ConsumerTask implements Runnable {
        @Override
        public void run() {
            while (!Thread.interrupted() && !isFinished()) {
                if (queue.isEmpty()) {
                    try {
                        Thread.sleep(100);
                    } catch (InterruptedException e) {
                    }

                    continue;
                }

                List<String> tasks = new ArrayList<String>(NUM);
                queue.drainTo(tasks, NUM);
                if (tasks.isEmpty()) {
                    continue;
                }

                Jedis jedis = redisPool.getResource();
                Pipeline pipeline = jedis.pipelined();

                try {
                    List<Response<String>> resultList = new ArrayList<Response<String>>(
                            tasks.size());

                    List<String> waitDeleteList = new ArrayList<String>(
                            tasks.size());

                    for (String task : tasks) {
                        String key = task.split(" ")[1];
                        if (task.startsWith("get_key")) {
                            resultList.add(pipeline.get(key));
                            waitDeleteList.add(key);
                        } else if (task.startsWith("del_key")) {
                            pipeline.del(key);
                        }
                    }

                    pipeline.sync();

                    // 处理返回列表
                    for (int i = 0; i < resultList.size(); i++) {
                        resultList.get(i).get();
                        // handle value here ...
                        // System.out.println("get value " + value);
                    }

                    // 读取完毕，直接删除之
                    for (String key : waitDeleteList) {
                        pipeline.del(key);
                    }

                    pipeline.sync();
                } catch (Exception e) {
                    redisPool.returnBrokenResource(jedis);
                } finally {
                    redisPool.returnResource(jedis);
                }
            }
        }
    }

    private static boolean isFinished(){
        return finished;
    }

    private static void setFinished(boolean bool){
        finished = bool;
    }
}

代码作为示范。若线上则需要处理一些异常等。

小结

若能够批量请求进行合并操作，自然可以节省很多的网络带宽、CPU等资源。有类似问题的同学，不妨考虑一下。

posted on 2014-11-09 22:08 nieyong 阅读(16174) 评论(17) 编辑收藏所属分类: Socket

# re: 为什么批量请求要尽可能的合并操作 2014-11-10 09:34 下巴长痘痘是什么原因

经过楼主的讲解，我现在才明白为什么批量请求要尽可能的合并操作回复更多评论

# re: 为什么批量请求要尽可能的合并操作[未登录] 2014-11-11 13:36 刘洋

好专业啊...每个月有一谝回复更多评论

# re: 为什么批量请求要尽可能的合并操作 2014-11-13 14:37 Stanley Xu

线程数要根据cpu的情况而决定的，一台4核的机器开40个线程就是蛋疼。同步、context switch的开销已经超过了线程带来的优势。如果不合并，仅仅减少线程数，性能也会有所优化。回复更多评论

# re: 为什么批量请求要尽可能的合并操作 2014-11-16 09:12 妞妞宝贝衣间

支持博主分享，欢迎到我的小店、、、、回复更多评论

# gank开黑吧 2014-11-16 22:13 gank开黑吧

gank开黑吧http://www.kaihei8.com 赞一下博主回复更多评论

# re: 为什么批量请求要尽可能的合并操作 2014-11-16 23:37 网络营销技巧

看了楼主的讲解，我现在才大致明白回复更多评论

# re: 为什么批量请求要尽可能的合并操作 2014-11-17 14:32 脸上长粉刺是什么原因

不错的文章，学习了回复更多评论

# 武冈SEO 2014-11-25 22:57 794680490@qq.com

文章很实用，学习了，到时实践下回复更多评论

# re: 为什么批量请求要尽可能的合并操作 2015-01-24 15:09 黎洪鑫

请教一下，我们使用pipeline的方式后，出现了在一些闲时，内存暴涨。然后kill掉twemproxy之后就降下来了。然后查了相关的资料，把pipeline的数量降到500，甚至20了，仍然出现。而且11台机器中，有一些机器经常出现，但是最近经常出现的不出现，从没出现的又出现这情况了。不知道您是否有遇到过，如果解决。回复更多评论

# re: 为什么批量请求要尽可能的合并操作 2015-01-26 09:39 nieyong

@黎洪鑫
没有遇见过类似问题，爱莫能助。
因为pipeline是一个阻塞请求-响应过程，这一点很重要；另外网络机房拥塞会导致非常大的延迟，具体情况就是请求发出去，等待很长时间响应。若是机房网络延迟问题，可以考虑把pipeline异步提交，不要阻塞当前线程。
以上都是建议，仅供参考！回复更多评论

# re: 为什么批量请求要尽可能的合并操作 2015-01-26 10:46 黎洪鑫

多谢了，我先做一下升级看看情况会不会改善。@nieyong
回复更多评论

# re: 为什么批量请求要尽可能的合并操作 2015-05-28 10:05 tinsang

@nieyong
可以考虑把pipeline异步提交，不要阻塞当前线程 ;

这个异步是指？不是很明白回复更多评论

# re: 为什么批量请求要尽可能的合并操作 2015-05-28 17:04 nieyong

@tinsang
把较为耗时任务委派到其它线程处理，当前业务线程继续忙别的。回复更多评论

# re: 为什么批量请求要尽可能的合并操作 2015-05-28 19:01 tinsang

@nieyong
那我明白你的意思了回复更多评论

# re: 为什么批量请求要尽可能的合并操作 2015-05-28 19:02 tinsang

@nieyong
pipeline阻塞了，那其他请求redis不是一样被阻塞了？回复更多评论

# re: 为什么批量请求要尽可能的合并操作 2015-05-29 09:52 nieyong

@tinsang
针对单台Redis而言，单线程模型。一旦pipeline阻塞了，其它请求会被阻塞住。可考虑单线程操作管道，一个一个批处理。回复更多评论

# re: 为什么批量请求要尽可能的合并操作 2016-05-16 17:45 zhouwei

private static boolean finished = false;
finished变量应该为volatile。
楼主这么牛逼的人不应该犯这种小错误 ^_^
好文章，学习了～回复更多评论

新用户注册刷新评论列表


只有注册用户登录后才能发表评论。




网站导航: 博客园 IT新闻 Chat2DB C++博客博问管理
相关文章: SO_REUSEPORT学习笔记补遗 SO_REUSEPORT学习笔记 Fastsocket学习笔记之小结篇 Fastsocket学习笔记之内核篇 Fastsocket学习笔记之模块篇 Fastsocket学习笔记之动态链接库篇 Fastsocket学习笔记之网卡设置篇 Fastsocket学习笔记之安装篇 Fastsocket学习笔记之示范应用篇 Fastsocket学习笔记之开篇

聂永的博客