jinfeng_wang

G-G-S,D-D-U!

BlogJava

管理

400 Posts :: 0 Stories :: 296 Comments :: 0 Trackbacks

缓存系列文章--4.缓存的粒度控制

转载请注明出处哈:http://carlosfu.iteye.com/blog/2269678

一、什么是缓存粒度

下面这个图是很多项目关于缓存使用最常用的一个抽象，那么我们假设storage层为mysql, cache层为redis。

假如我现在需要对视频的信息做一个缓存，也就是需要对select * from video where id=?的每个id在redis里做一份缓存，这样cache层就可以帮助我抗住很多的访问量（注：这里不讨论一致性和架构等等问题，只讨论缓存的粒度问题）。

我们假设视频表有100个属性（这个真有，有些人可能难以想象），那么问题来了，需要缓存什么维度呢，也就是有两种选择吧：

Java代码  
(1)cache(id)=select * from video where id=#id  
(2)cache(id)=select importantColumn1, importantColumn2 .. importantColumnN from video where id=#id  

其实这个问题就是缓存粒度问题，我们在缓存设计应该佮预估和考虑呢？下面我们将从通用性、空间、代码维护三个角度进行说明。

二、全部数据和部分数据比较

1. 两者的特点是显而易见的：

数据类型

通用性

空间占用（内存空间 + 网络码率）

代码维护

全部数据

高

大

简单 

部分数据

低

小

 较为复杂

2. 通用性：

如果单从通用性上看，全部数据是最优秀的，但是有个问题就是是否有必要缓存全部数据，认为以后会有这样的需求，但是从经验看除了非常重要的信息，那些不重要的字段基本不会在需求里出现，也就是说这种通用性通常都是想象出来的。太多人觉得通用性是最重要的。vid拿一些基本信息，会想专辑明星。。要不要用通用性高的，于是加了全局的，通用性很重要，但是要想清楚。

3. 空间占用：

很显然，缓存全部数据，会占用大量的内存，有人会说，不就费一点内存吗，能有多少钱？而且已经有人习惯了把缓存当做下水道来使用，什么都框框的往里面放，但是我这里要说内存并不是免费的，可以说是很珍贵的资源。instagram21->4G的例子就说明了这个道理，好的程序员可以帮助公司节约大量的资源。

而且单个cache(id)也带来两个问题：序列化的开销和网络流量的开销（QPS,百倍），都是无容忽视的。

4. 代码维护：

代码维护性，全部数据的优势更加明显，而部分数据一旦要加新字段就会修改代码，而且还需要对原来的数据进行刷新。

三、总结：

缓存粒度问题是一个容易被忽视的问题，如果使用不当，可能会造成很多无用空间的浪费，可能会造成网络带宽的浪费，可能会造成代码通用性较差等情况，必须学会综合数据通用性、空间占用比、代码维护性三点评估取舍因素权衡使用。

posted on 2016-12-20 17:13 jinfeng_wang 阅读(186) 评论(0) 编辑收藏所属分类: 2016-REDIS

新用户注册刷新评论列表


只有注册用户登录后才能发表评论。




网站导航: 博客园 IT新闻 Chat2DB C++博客博问管理
相关文章: 缓存系列文章--7.无底洞问题(multiget hole) 缓存系列文章--6.缓存雪崩问题缓存系列文章--5.缓存穿透问题缓存系列文章--4.缓存的粒度控制缓存系列文章--2.是否真的需要缓存？缓存系列文章--3.缓存常用更新策略对比(一致性)。缓存系列文章--1.缓存的一些基本常识 JedisCluster 源码分析 redis cluster使用经验深入浅出Redis（三）高级特性：管道

jinfeng_wang

公告

常用链接

留言簿(40)

随笔分类(592)

随笔档案(400)

Domestic

Foreign

搜索

积分与排名

最新评论

阅读排行榜

评论排行榜

转载请注明出处哈:http://carlosfu.iteye.com/blog/2269678