歪歪之数据库

题记：主要记录同学分享的关于数据库设计方面的内容，思考过一点，记录下来。

一、从需求开始，考虑数据库的设计，且结合具体数据库特性

  一个论坛，要求显示帖子的总条数，对于mysql、innodb引擎；上线前期完全没有问题，当人气积累，帖子达到千万级别时，此时性能的问题就会显现出来。好的设计，是需求阶段就要考虑的。对于我，这是一个思想概念上的转变。
  但引擎如果换成myisam，就算数据达到亿的级别，“统计总数”这样的问题还会存在吗？不会，myisam自身就会维护总数信息。因此设计，必须结合具体的数据库的特性来做，不能以一概全。

二、应该遵循原则（未验证）

  1.小结果集驱动大结果集。理由：mysql的连接查询原理？
  2.尽可能在索引中完成排序。理由：索引本身就是有序的
  3.只取自己需要的column ？
  4.避免复杂的连接查询和子查询。
  5.适当的数据冗余.理由：帖子表&用户表，如果帖子表拥有username，则每次帖子的显示是不需要连接查询获取username。
  6.应用层的cahce机制？

三、概念

  1.垂直拆分：按列进行分割，即把一条记录分开多个地方保存，每个子表的行数相同。帖子表，id、userid、username、content、xxx ...前面4个字段很常用，但是后面xxx等很多字段，不常用，数据量很大。进行垂直拆分，table1字段包含“id、userid、username、content”,table2包含“xxx、...”等不常用字段。优点：减少io的操作。缺点：如果需要不常用字段信息，需要连表查询。
  2.水平拆分：按记录进分分割，不同的记录分开保存，每个子表的列数相同。比如：淘宝的用户交易数据，根据用户id取模，确定具体的数据存放在那个数据库。水平拆分会给应用带来复杂性。
  3.集群：提高系统的可用性。分库的节点引入多台机器，每台机器保存的数据是一样，负载均衡在多台机器。如何均衡、探测机器的可用性，是新的问题？
  4.主备：一般的互联网应用中，经过一些数据调查得出结论，读/写的比例大概在 10：1左右。为什么要读写分离：写操作涉及到锁的问题，不管是行锁还是表锁还是块锁，在大并发的情况下，效率很低。写操作集中在一个节点上，而读操作其其他的N个节点上进行。读写分离引入的新问题：比如我的Master上的数据怎样和集群中其它Slave机器保持数据的同步和一致呢?

posted on 2010-11-07 17:53 石建 | Fat Mind 阅读(494) 评论(0) 编辑收藏所属分类: database

新用户注册刷新评论列表


只有注册用户登录后才能发表评论。




网站导航: 博客园博客园最新博文博问管理
相关文章: 歪歪之数据库 sql连接查询

石建 | Fat Mind

歪歪之数据库

导航

统计

常用链接

留言簿

随笔分类

随笔档案

搜索

最新评论